随风而行

soundslow


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 游戏

  • 搜索

机器学习实战-14利用SVD简化数据-改进推荐系统

发表于 2017-11-18 | 分类于 ML/DL
字数统计: 2.7k | 阅读时长 ≈ 11
虽然本章标题是SVD,但是感觉本章的内容核心却有点像是推荐系统,SVD的主要作用优化数据,简化运算。对于推荐系统,生活中处处都是,比如火热的网易云音乐,其中就是用到的因子推荐算法,记得我的第一篇博客就是从知乎上转载下来的;另外还有今日头条;其他的应用其实也有,但是自我感觉,这两个应用应该是最好的。 ...
阅读全文 »

机器学习实战-13利用PCA来简化数据

发表于 2017-11-17 | 分类于 ML/DL
字数统计: 2.3k | 阅读时长 ≈ 8
最近正在做一个语音分离的任务,其中有一个语音分离的方法叫做NMF,中文非负矩阵分解,即将矩阵表示为V=WH,mn = mr * r*n;其实这种矩阵分解的方式和本章的内容类似,也是对矩阵进行降维或者简化矩阵;其实有时候并不仅仅是降维,这种方式,也是一种变相提取特征值得过程,其中的W相当于特征向量组 ...
阅读全文 »

机器学习实战-6支持向量机

发表于 2017-11-16 | 分类于 ML/DL
字数统计: 3.3k | 阅读时长 ≈ 11
在机器学习几大算法中,支持向量应该算是应用最广泛的,但是却也是理解最困难的。相对于其他的算法而言,这个算法的逻辑可能并不难难,难的是它的内部逻辑转换,如何转化求解最大超平面。其实最近我在想,机器学习有时候感觉理解起来并不太难,有时候相对于其他知识来说,比如电磁场,固体物理等,简直是最简单的,甚至感 ...
阅读全文 »

机器学习实战-7AdaBoost提升算法

发表于 2017-11-05 | 分类于 ML/DL
字数统计: 2.9k | 阅读时长 ≈ 11
这一章的主要思想就是“三个臭皮匠赛一个诸葛亮”。一般而言,我们都是通过一个分类器进行分类,但是一个分类器可能会出现偶然误差错误,就像一个人总会出现失误一样。所以,我们学习多个不同的分类器,然后将这些分类器通过加上不同的权重组合起来,就形成了一种强大的集成分类器。而这其中,可以再次改进,对不同的分类 ...
阅读全文 »

机器学习实战-4朴素贝叶斯-python3

发表于 2017-11-03 | 分类于 ML/DL
字数统计: 1.7k | 阅读时长 ≈ 7
==这一章原理很简单,相关的知识到处都是,《数学之美》讲过,《统计学习方法》西瓜书都有详细的概述。但是就是一个简单的概率问题,如果真正遇到实际问题,却也并不是很好解决的。这其中往往是实际操作时往往和理论空想不同,数据的合理安排非常重要。贝叶斯的使用非常广泛,其实就目前而言,现实生活中很多的人工智能方 ...
阅读全文 »

机器学习实战-11关联分析Apriori算法-pytohn3

发表于 2017-10-28 | 分类于 ML/DL
字数统计: 2.8k | 阅读时长 ≈ 12
==感悟:这一章的理论很浅,浅到似乎只需要一个数学公式就能够表达。但是这一章却花费了我整整两天时间。有时候我在想,为什么总是有人很多人想得多做得少,理论很深却只会纸上谈兵。很长的一段时间我就是这种人,自以为智力还算可以,很多数学问题自认为很简单,看了很多书,学了很多知识,但真正向别人讲解时,却怎么也 ...
阅读全文 »

机器学习实战-5Logistic回归

发表于 2017-10-17 | 分类于 ML/DL
字数统计: 1.6k | 阅读时长 ≈ 7
几个关键词:逻辑回归、极大似然估计、激活函数 参考书籍:西瓜书P54,《统计学习方法》P77 回归和分类的区别回归是一种连续变量的预测,比如函数拟合,股票线等,人的年龄。分类的特征却不是连续变化的,比如西瓜的颜色是不能连续量化的 线性回归 举个例子,如果我们现在有两个未知数x1,x2,即特征 ...
阅读全文 »

Tensorflow实战Google-第四章深层神经网络知识点

发表于 2017-10-04 | 分类于 ML/DL
字数统计: 1.5k | 阅读时长 ≈ 5
1.深层神经网络的两个重要参数:多层和非线性 非线性: 相对于以往的神经网络,由于没有使用激活函数,构造出来的函数往往形如:w1x1+w2x2+…+wnxn + b = 0,很显然这种函数只能模拟线性分割。即只能通过直线来划分,一旦分割面是一个圆形,通过这种方式只能尽可能的得到一个多棱角保卫面, ...
阅读全文 »

机器学习实战-3决策树

发表于 2017-09-15 | 分类于 ML/DL
字数统计: 685 | 阅读时长 ≈ 3
划分依据决策树的主要依据为信息熵计算,信息熵最大的最为分类依据 流程创建数据集 –> 计算信息熵,最大值作为结点,划分子数据集 –> 递归寻找 代码 1234567891011121314151617181920212223242526272829303132333435363 ...
阅读全文 »

大化设计模式-单例模式

发表于 2017-09-15 | 分类于 网站架构
字数统计: 314 | 阅读时长 ≈ 1
原理:保证一个类只有一个实例对象,提供一个对外的实例创建方法。 好处: 数据共享,多个线程可以共用一个实例,共同享用这个实例的资源属性(如数据库连接器) 线程安全,通过线程加锁,可以达到并发访问的目的 节约资源,防止创建过多不必要的对象 结构图![enter description ...
阅读全文 »
上一页1…345下一页
soundslow

soundslow

I take the newer medications, but I still see things that are not here.

42 日志
8 分类
101 标签
RSS
GitHub CSDN 豆瓣 知乎
友情链接
  • 阿里中间件
  • 美团点评
  • IBM
© 2013 — 2020 soundslow
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4
本站总访问量 次 | 访问人数 人
博客全站共85.6k字