Adline125's Blog

NLP Engineer, Google Developers Expert

0%

本文是对论文Evaluation methods for unsupervised word embeddings的总结。相较于大量生成词嵌入模型的研究,评估词嵌入模型的工作相对较少。 该论文是第一篇对词嵌入评估进行深入研究的论文,发表于2015年,涵盖了广泛的评估标准和当时流行的嵌入技术。其目的并非是证明某个词嵌入方法优于其他方法,而是要对词嵌入的评估方法本身做较深入的探讨。

Read more »

本文是对论文From Word Embeddings To Document Distances的总结和code实现。该论文基于word2vec embedding 和EMD(Earth Mover's Distance)提出了一种新的计算文档距离的算法WMD(Word Mover's Distance)。旨在解决 Obama speaks to the media in IllinoisThe President greets the press in Chicago 仅仅因词语拼写不同而导致距离很远的不合理现象。尽管这两个句子对应的词语在语义上是相近的。

Read more »