Adline125's Blog

Rasa NLU SKLearn Classifier解析

Posted on 2022-10-21

本文是对著名对话机器人开源框架Rasa NLU Sklearn classifier架构的解析。Rasa是一套开源机器学习框架，用于构建基于上下文的AI小助手和聊天机器人。Rasa有两个主要模块：Rasa NLU 用于对用户消息内容的语义理解；Rasa Core 用于对话管理（Dialogue management）。本文主要针对Rasa NLU Sklearn classifier做细节上的说明。

本文更多关注算法，主要内容如下：

Rasa NLU DIET Classifier解析

Posted on 2022-10-21

本文是对著名对话机器人开源框架Rasa NLU classifier中最受欢迎的DIET Classifier的解析。Rasa是一套开源机器学习框架，用于构建基于上下文的AI小助手和聊天机器人。Rasa有两个主要模块：Rasa NLU 用于对用户消息内容的语义理解；Rasa Core 用于对话管理（Dialogue management）。本文主要针对Rasa NLU classifier 中的DIET Classifier做详细的说明。

本文更多关注算法，主要内容如下：

Rasa NLU架构解析

Posted on 2022-10-21

本文是对著名对话机器人开源框架Rasa NLU架构的解析。Rasa是一套开源机器学习框架，用于构建基于上下文的AI小助手和聊天机器人。Rasa有两个主要模块：Rasa NLU 用于对用户消息内容的语义理解；Rasa Core 用于对话管理（Dialogue management）。本文主要针对Rasa NLU各部分做细节上的说明。

本文更多关注算法，主要内容如下：

Rasa NLU classifier解析

Posted on 2020-10-21 Edited on 2022-10-21

本文是对著名对话机器人开源框架Rasa NLU classifier架构的解析。Rasa是一套开源机器学习框架，用于构建基于上下文的AI小助手和聊天机器人。Rasa有两个主要模块：Rasa NLU 用于对用户消息内容的语义理解；Rasa Core 用于对话管理（Dialogue management）。本文主要针对Rasa NLU classifier 做总体上的说明。

本文更多关注算法，主要内容如下：

Bidirectional LSTM-CRF Models for Sequence Tagging

Posted on 2020-07-15 Edited on 2020-07-20 In NLP

本文是对论文Bidirectional LSTM-CRF Models for Sequence Tagging的总结。文章系统地比较了基于LSTM网络的各种序列标记模型的性能。并在当时首次将BI-LSTM-CRF模型应用于NLP基准序列标记任务。其中，BI-LSTM-CRF模型在词性标注，分块和命名实体识别任务上表现最优。模型具有鲁棒性且对单词嵌入的依赖性较小，甚至可以无需借助词嵌入达到一定的精度。

Evaluation methods for unsupervised word embeddings

Posted on 2020-07-04 Edited on 2020-07-05 In NLP

本文是对论文Evaluation methods for unsupervised word embeddings的总结。相较于大量生成词嵌入模型的研究，评估词嵌入模型的工作相对较少。该论文是第一篇对词嵌入评估进行深入研究的论文，发表于2015年，涵盖了广泛的评估标准和当时流行的嵌入技术。其目的并非是证明某个词嵌入方法优于其他方法，而是要对词嵌入的评估方法本身做较深入的探讨。

WMD论文总结及代码实现: From Word Embeddings To Document Distances

Posted on 2020-06-04 Edited on 2024-06-18 In NLP

本文是对论文From Word Embeddings To Document Distances的总结和code实现。该论文基于word2vec embedding 和EMD（Earth Mover's Distance）提出了一种新的计算文档距离的算法WMD（Word Mover's Distance）。旨在解决 Obama speaks to the media in Illinois 和 The President greets the press in Chicago 仅仅因词语拼写不同而导致距离很远的不合理现象。尽管这两个句子对应的词语在语义上是相近的。

XGBoost: A Scalable Tree Boosting System

Posted on 2020-06-01 Edited on 2020-07-04

本文是对XGBoost的经典论文XGBoost: A Scalable Tree Boosting System的总结。XGBoost 的全称是 eXtreme Gradient Boosting。作者为华盛顿大学研究机器学习的大牛陈天奇，其最大的特点在于，它能够自动利用 CPU 的多线程进行并行，同时在算法上加以改进提高了精度。

本文更多关注算法，主要内容如下：

Hello World

Posted on 2020-05-23 Edited on 2020-06-01

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.