来和你的计算机玩个猜词游戏吗?
这个叫Pimantle的猜词游戏,规则很简单:
随便输入一个单词,如果它越接近谜底,就会离下图的中心点越近。
在完全没有范围限制和人工提示的情况下,通过计算机反馈的辅助,网友给出的最接近预设词的是“delicatessen”(熟食),与谜底相似度已经达到了79.20。
不过,友友们是否好奇——这么多次猜测背后,计算机是怎么判断单词之间的“相似度”的啊?
其实,这是基于NLP领域的一个常用工具——Word2Vec。
顾名思义,它可以将单词转换成向量形式,来辅助计算机判断词义。
Word2Vec是Tomas Mikolov等人于2013年提出的一个词嵌入生成方法。
它在潜在语义分析等方面优于之前的算法,在判断文本相似度、系统推荐、观点分析等方面都具有广泛的应用。
一名研究机器学习的工程师Vatsal在Towards Data Science发布了一篇介绍Word2Vec的文章,并收获了相当不错的关注度。
这个叫Pimantle的猜词游戏,规则很简单:
随便输入一个单词,如果它越接近谜底,就会离下图的中心点越近。
在完全没有范围限制和人工提示的情况下,通过计算机反馈的辅助,网友给出的最接近预设词的是“delicatessen”(熟食),与谜底相似度已经达到了79.20。
不过,友友们是否好奇——这么多次猜测背后,计算机是怎么判断单词之间的“相似度”的啊?
其实,这是基于NLP领域的一个常用工具——Word2Vec。
顾名思义,它可以将单词转换成向量形式,来辅助计算机判断词义。
Word2Vec是Tomas Mikolov等人于2013年提出的一个词嵌入生成方法。
它在潜在语义分析等方面优于之前的算法,在判断文本相似度、系统推荐、观点分析等方面都具有广泛的应用。
一名研究机器学习的工程师Vatsal在Towards Data Science发布了一篇介绍Word2Vec的文章,并收获了相当不错的关注度。