总结:火车头结合采集京东并免登录发布magento系统

作者:stoat 发布时间:2014-07-08 分类:技术

采用了火车头企业版做的,在结合免登录发布Magento的时候,发现不支持中文标题(主要是因为相册原因)直接发布,所以需要结合火车头企业版翻译成英文。

1,京东图片无水印采集总结见:http://www.stoatme.com/183.html
2,多页获取京东商品价格需要利用其api:http://p.3.cn/prices/mgets?type=1&skuIds=J_(id)
获取京东商品价格.jpg
3,京东的父子产品会在同一段js中定义,故获取尺寸/颜色后需要做去重复处理,php数组去重复很简单

$array = array_unique($array);

4,Magento免登录模式发布需要利用自身api,详见Magento产品管理api,掌握了这几项,基本就ok了。
5,根据火车头采集数据让Magento自动创建分类,记得设置默认为空的情况,有些坑爹的网站(比如amazon),在采集的时候可能结果为空。
火车头Magento自动创建分类
6,火车头获取当前采集页面地址,首先创建一个标签为本文网址,勾选后面的“从网址中采集”。
选择下面的“正则提取”,点击通配符“(??)”,这样在窗口中就显示为(?[\s\S]*?)
我们再在它前加一个与字符串开始的地方匹配的符号^,又在它后面加一个与字符串结束的地方匹配的符号$,这样就变成了
^(?[\s\S]*?)$
。如图:火车头怎样采集当前文章的url网址
Content  代表内容
?        表示匹配0次或者1次
\s        匹配所有空白字符
\S        匹配所有非空白字符
*       修饰匹配次数为 0 次或任意次

7,结果预览:
火车头结合采集京东并免登录发布magento系统.jpg

以上,总结,完毕。

原文地址:总结:火车头结合采集京东并免登录发布magento系统 by 雪鼬博客

标签:Magento 京东 火车头 采集

评论已关闭