决策树

决策树

决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。 决策树方法最早产生于上世纪60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题。 决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进

词向量

词向量

词向量(Word embedding),又叫Word嵌入式自然语言处理(NLP)中的一组语言建模和特征学习技术的统称,其中来自词汇表的单词或短语被映射到实数的向量。 从概念上讲,它涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。 生成这种映射的方法包括神经网络,单词共生矩阵的降维,概率模型,可解释的知识库方法,和术语的显式表示 单词出现的背景。 当用作底层输入表示时,单词和短语嵌入已经被证明可以提高NLP任务的性能,例如语法分析和情感分析。 思想向量是单词嵌入到整个句子甚至文档的扩展。一些研究人员希望这些可以提高机器翻译的质量。 为什么需要词向量? 众所周知,不管是机器学习还是深度学习本质上都是对数字的数

百度自然语言处理接口

百度自然语言处理接口

词法分析 分词、词性标注、专名识别 依存句法分析 自动分析文本中的依存句法结构信息 词向量表示 查询词汇的词向量,实现文本的可计算 DNN语言模型 判断一句话是否符合语言表达习惯 词义相似度 计算两个给定词语的语义相似度 短文本相似度 判断两个文本的语义相似度 中文分词 切分出连续文本中的基本词汇序列(已合并到词法分析接口) 词性标注 为自然语言文本中的每个词汇赋予词性(已合并到词法分析接口)

深度学习和机器学习的区别

深度学习和机器学习的区别

首先看看机器学习的定义: “A computer program is said to learn from experience E with respect to some class of tasksT and performance measureP if its performance at tasks inT, as measured by P, improves with experience E ”(这段话我真的是看了100遍才知道怎么断句啊!!(Д)) 翻译过来就是:“一个电脑程序要完成任务(T),如果电脑获取的关于T的经验(E)越多就表现(P)得越好,那么我们就可以说这个程序‘学习’了关于T的经验。” 简单来说,就是解释什么叫“机器的学习”,如果输入的经验越多表现的越好,这就叫“学习”嘛。 我们首先浏览所有的历史风暴数据,从这些大量的数据中学习出某些“模式”,这些“模式”包含

基于用户标签的推荐系统

基于用户标签的推荐系统

拿到了用户标签行为数据,相信大家都可以想到一个最简单的个性化推荐算法。这个算法的描述如下所示: 1)统计每个用户最常用的标签。 2)对于每个标签,统计被打过这个标签次数最多的物品。 3)对于一个用户,首先找到他常用的标签,然后找到具有这些标签的最热门物品推荐给这个用户 未完待续

CMU博士Tom Murphy的人工智能超级马里奥

CMU博士Tom Murphy的人工智能超级马里奥

跑了一下CMU博士Tom Murphy的人工智能程序来玩任天堂的超级马里奥,虽然是2013年就出来了,但是还是很激动呀。 这是他本人的博客:http://radar.spacebar.org/ 资源都在这个网上有:http://www.cs.cmu.edu/~tom7/mario/ 在文章的最下边是论文链接、源程序和编译好的可执行文件。 论文链接:http://www.cs.cmu.edu/~tom7/mario/mario.pdf 源程序:http://sourceforge.net/p/tom7misc/svn/HEAD/tree/trunk/tasbot/ 可执行程序:http://www.cs.cmu.edu/~tom7/mario/playfun.7z 解压playfun.7z压缩包,会看到这些程序 打开readme文档,看作者的步骤提示: 1、运行平台是win7 64位系统 2、FCEUX是必须的,录制视频和回放人工智能玩的游戏都是靠这个