机器学习实战-14利用SVD简化数据-改进推荐系统

发表于 2017-11-18 | 分类于 ML/DL

字数统计: 2.7k | 阅读时长 ≈ 11

虽然本章标题是SVD，但是感觉本章的内容核心却有点像是推荐系统，SVD的主要作用优化数据，简化运算。对于推荐系统，生活中处处都是，比如火热的网易云音乐，其中就是用到的因子推荐算法，记得我的第一篇博客就是从知乎上转载下来的；另外还有今日头条；其他的应用其实也有，但是自我感觉，这两个应用应该是最好的。 ...

阅读全文 »

机器学习实战-13利用PCA来简化数据

发表于 2017-11-17 | 分类于 ML/DL

字数统计: 2.3k | 阅读时长 ≈ 8

最近正在做一个语音分离的任务，其中有一个语音分离的方法叫做NMF，中文非负矩阵分解，即将矩阵表示为V=WH，mn = mr * r*n；其实这种矩阵分解的方式和本章的内容类似，也是对矩阵进行降维或者简化矩阵；其实有时候并不仅仅是降维，这种方式，也是一种变相提取特征值得过程，其中的W相当于特征向量组 ...

阅读全文 »

机器学习实战-6支持向量机

发表于 2017-11-16 | 分类于 ML/DL

字数统计: 3.3k | 阅读时长 ≈ 11

在机器学习几大算法中，支持向量应该算是应用最广泛的，但是却也是理解最困难的。相对于其他的算法而言，这个算法的逻辑可能并不难难，难的是它的内部逻辑转换，如何转化求解最大超平面。其实最近我在想，机器学习有时候感觉理解起来并不太难，有时候相对于其他知识来说，比如电磁场，固体物理等，简直是最简单的，甚至感 ...

阅读全文 »

机器学习实战-7AdaBoost提升算法

发表于 2017-11-05 | 分类于 ML/DL

字数统计: 2.9k | 阅读时长 ≈ 11

这一章的主要思想就是“三个臭皮匠赛一个诸葛亮”。一般而言，我们都是通过一个分类器进行分类，但是一个分类器可能会出现偶然误差错误，就像一个人总会出现失误一样。所以，我们学习多个不同的分类器，然后将这些分类器通过加上不同的权重组合起来，就形成了一种强大的集成分类器。而这其中，可以再次改进，对不同的分类 ...

阅读全文 »

机器学习实战-4朴素贝叶斯-python3

发表于 2017-11-03 | 分类于 ML/DL

字数统计: 1.7k | 阅读时长 ≈ 7

==这一章原理很简单，相关的知识到处都是，《数学之美》讲过，《统计学习方法》西瓜书都有详细的概述。但是就是一个简单的概率问题，如果真正遇到实际问题，却也并不是很好解决的。这其中往往是实际操作时往往和理论空想不同，数据的合理安排非常重要。贝叶斯的使用非常广泛，其实就目前而言，现实生活中很多的人工智能方 ...

阅读全文 »

机器学习实战-11关联分析Apriori算法-pytohn3

发表于 2017-10-28 | 分类于 ML/DL

字数统计: 2.8k | 阅读时长 ≈ 12

==感悟：这一章的理论很浅，浅到似乎只需要一个数学公式就能够表达。但是这一章却花费了我整整两天时间。有时候我在想，为什么总是有人很多人想得多做得少，理论很深却只会纸上谈兵。很长的一段时间我就是这种人，自以为智力还算可以，很多数学问题自认为很简单，看了很多书，学了很多知识，但真正向别人讲解时，却怎么也 ...

阅读全文 »

机器学习实战-5Logistic回归

发表于 2017-10-17 | 分类于 ML/DL

字数统计: 1.6k | 阅读时长 ≈ 7

几个关键词：逻辑回归、极大似然估计、激活函数参考书籍：西瓜书P54,《统计学习方法》P77 回归和分类的区别回归是一种连续变量的预测，比如函数拟合，股票线等，人的年龄。分类的特征却不是连续变化的，比如西瓜的颜色是不能连续量化的线性回归举个例子，如果我们现在有两个未知数x1,x2,即特征 ...

阅读全文 »

Tensorflow实战Google-第四章深层神经网络知识点

发表于 2017-10-04 | 分类于 ML/DL

字数统计: 1.5k | 阅读时长 ≈ 5

1.深层神经网络的两个重要参数：多层和非线性非线性：相对于以往的神经网络，由于没有使用激活函数，构造出来的函数往往形如：w1x1+w2x2+…+wnxn + b = 0,很显然这种函数只能模拟线性分割。即只能通过直线来划分，一旦分割面是一个圆形，通过这种方式只能尽可能的得到一个多棱角保卫面， ...

阅读全文 »