首页 > 问答 > 分词过程中,行业词典如何完善?

分词过程中,行业词典如何完善?

[导读]:关键词分词中,由于行业的不同,同一份词典产生的分词结果也有较大差异,很多行业产品,术语都无法正确拆分。 那么在建立行业词典的时候,有什么好的完善思路,包括词...

关键词分词中,由于行业的不同,同一份词典产生的分词结果也有较大差异,很多行业产品,术语都无法正确拆分。

那么在建立行业词典的时候,有什么好的完善思路,包括词频,词性的正确设置。

一个行业词库几千万的关键词,如果手工整理的话,工作量太大了。

请教各位大神,有没有一个好的完善思路。

词库的维护以及分类整理思路:www点imyexi点com/?p=853 (来自夜息博客)

###

行业词典可是个大工具啊,可以参见下B2B的分类框架,然后去到各分类整理,这不是个容易活啊

###

我的经验来说吧。可以先找主关键词。如卖桌子,可以找下桌子的相关主关键词,红木桌子、木制桌子,然后扩展,桌子价格、出售、寄卖等等。可以用excel公式生成。找行业词,完全靠工具,基本是不靠谱的,还是要有自己手动力整理一部分。

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/24847.html