有什么接口可以对淘宝上的产品标题做分词?
这个需求首推淘宝的taobao.nlp.word( 文本语言词法分析 ),毕竟 是基于淘宝庞大的产品库,
该接口地址是:http://open.taobao.com/api.htm?docId=26129&docType=2&source=search
但是也有缺陷,它只是对产品标题等关键字做分词,但没有提取核心词的功能,因此,要得到有效的结果或核心词,也是挺麻烦。
比如:“蚕丝被100%桑蚕丝春秋被加厚冬被夏凉被单人学生双人被子被芯全棉”
切割成:“蚕丝被 100 % 桑蚕丝 春秋被 加厚 冬被 夏凉被 单人 学生 双人被 子 被芯 全棉”
如果你想提取最核心的“蚕丝被”这个词,是没有办法的,只能用百度AI接口或腾讯NLP的词频分析。
下面是淘宝联盟taobao.nlp.word( 文本语言词法分析 )调用示例:
$c->appkey = 百川appkey; $c->secretKey = 百川secretKey; $c->format = 'json'; /**百川appkey http://open.taobao.com/api.htm?docId=26129&docType=2&source=search*/ $req = new NlpWordRequest; $req->setWType("1"); $text = new Text; $text->id="123"; $text->content="物流非常棒"; $text->type="3"; $req->setText(json_encode($text)); $resp = $c->execute($req); if(!empty($resp->wordresult->top_result)) $resp = $resp->wordresult->top_result; else $resp = '';