机器学习基础篇--监督学习经典案例(Python实现)

转载 2017年10月24日 00:00:00
640?wx_fmt=png&wxfrom=5&wx_lazy=1

机器学习基础篇--监督学习

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1监督学习经典案例

前几章讲过,机器学习监督学习模型的任务重点在于,根据已有的经验知识对未知样本的目标/标记进行预测。根据目标预测变量的类型不同,我们把监督学习任务大体分为分类学习与回归预测两类。

监督学习的流程:

首先准备训练数据,可以是文本、图像、音频等;然后抽取所有需要特征,形成特征向量(Feature Vectors);接着,把这些特征向量连同对应的标记/目标(Labels)一并送入学习算法(Machine Learning Algorithm)中,训练出一个预测模型(Predictive Model);然后,采用同样的特征提取方法作用于新测试数据,得到用于测试的特征向量;最后,使用预测模型对这些待测的特征向量进行预测并得到结果(Expected Labels)。

0?wx_fmt=jpeg分类学习

分类学习是常见的监督学习问题,其中最基础的便是二分类(Binary Classification)问题,即判断是非,从两个类别中选择一个作为预测结果;除此之外还有多分类(Multiclass Classification)的问题,即在多于两个类别中选择一个;

实际应用场景:

在实际生活和工作中,会遇到很多多分类的问题,如:医生对肿瘤性质的判断;邮件系统对手写体邮编数字进行识别;互联网资讯公司对新闻进行分类;甚至我们还能对某些大灾难的经历者做是否生还预测。

0?wx_fmt=jpegLogistic 回归

模型介绍:

假设现在有一些数据,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就是回归。Logistic 回归(Logistic Regressive)进行分类的主要思想:根据现有数据对分类边界线建立回归公式,以此进行分类。

实战示例:

数据:


0?wx_fmt=png

选择自变量和因变量:

0?wx_fmt=png

绘图展示:

0?wx_fmt=png

逻辑回归假设:

0?wx_fmt=png

0?wx_fmt=png

损失函数:

0?wx_fmt=png

向量化的损失函数(矩阵形式):

0?wx_fmt=png

0?wx_fmt=png


求偏导(梯度):

0?wx_fmt=png

向量化的偏导(梯度):

0?wx_fmt=png

代码实现:

0?wx_fmt=png

0?wx_fmt=png

最小化损失函数(梯度下降)

0?wx_fmt=png


预测部分:

0?wx_fmt=png

0?wx_fmt=png

0?wx_fmt=png

画决策边界

0?wx_fmt=png

0?wx_fmt=png


今日赠言

笑着面对,不去埋怨。悠然,随心,随性,随缘。注定一生改变的,只再百年后,那一朵花开的时间。

——坦然面对吧,致彷徨的您


推荐阅读:


机器学习篇

机器学习入门科普篇--系列二

机器学习算法的随机数据生成总结

python 数据清洗篇

python 数据清洗篇

想入门深度学习?先理解这25个概念!

自然语言处理中的Attention Model:是什么及为什么

用户画像之用户性别识别

机器学习入门科普篇--系列一

客户流失分析

全球变暖温度分析图

数据挖掘学习笔记--决策树C4.5

决策树你应该知道的几点

决策树的Python实现

机器学习之------K-Means(K均值)

机器学习算法与Python实践之(一)k近邻(KNN)

数据科学的完整学习路径

对线性回归、逻辑回归、各种回归的概念学习


python学习篇

优雅的Python

利用python操作Excel教程

让你的 Python 代码优雅又地道

Python笔记

python学习笔记

Python小知识:Python 迭代器与生成器

python函数简书

Python常用模块资料

Python 禅道

Python 字符串操作方法大全

Python的编码命名规则

python 数组的del ,remove,pop区别



参考文献:

Python机器学习及实践

机器学习

Mitchell,T.M 《Machine Learning》

http://www.cnblogs.com/pinard/p/5970503.html


深度 | 一篇文章带你进入无监督学习:从基本概念到四种实现模型(附论文)

作者:Eugenio Culurciello 机器之心编译 参与:李亚洲、武竞 微信公众号:(almosthuman2014)授权转载,禁止二次转载,点此为原文链接 这是今年 6 月份...
  • zb1165048017
  • zb1165048017
  • 2016年10月30日 20:25
  • 2069

【机器学习】半监督学习几种方法

转自:http://jiangkeke.blog.hexun.com/42322032_d.html 1.Self-training algorithm(自训练算法) 这个是最早提出的一种...
  • LG1259156776
  • LG1259156776
  • 2016年10月07日 18:29
  • 4549

机器学习笔记 监督学习算法小结(一)

前言坚持写博客半年多了,但感觉自己没有写技术博客的天赋,写出来的东西深度和广度都欠缺,也不容易理解。事实上大部分技术博客都存在这些问题,但即便写得不好,也会起到一定作用,所以我还是决定坚持写下去。接触...
  • qq_35064774
  • qq_35064774
  • 2017年02月04日 12:16
  • 1356

【备忘】2017年数据分析与机器学习实战到经典案例全套高清视频教程(基于Python3.5 anaconda4.2)15G

2017年数据分析与机器学习实战到经典案例全套高清视频教程(基于Python3.5 anaconda4.2)15G...
  • qq_38472400
  • qq_38472400
  • 2017年12月08日 18:14
  • 191

【备忘】2017Python数据分析与机器学习经典案例

Python数据分析(机器学习)经典案例 2017年 适用人群 从事机器学习,数据分析,数据挖掘的同学们以及python使用者 课程概述 选择经典案例基于真实数据集,从数据预处理开始到建...
  • qq_38155396
  • qq_38155396
  • 2018年01月14日 11:36
  • 18

【备忘】Python数据分析(机器学习)经典案例视频教程

Python数据分析(机器学习)经典案例视频教程
  • qq_38472524
  • qq_38472524
  • 2017年12月22日 12:14
  • 117

[机器学习收藏] TensorFlow初学者必须了解的55个经典案例

TensorFlow初学者必须了解的55个经典案例 导语:本文是TensorFlow实现流行机器学习算法的教程汇集,目标是让读者可以轻松通过清晰简明的案例深入了解 TensorFlow。...
  • soulmeetliang
  • soulmeetliang
  • 2017年07月21日 17:06
  • 3761

Python机器学习应用 | 无监督学习课程测验

1单选(2分) 以下距离度量方法中,要对样本点的各个属性进行标准化的是: A.马氏距离 B.欧氏距离 C.曼哈顿距离 D.夹角余弦正确答案:A2单选(2分) 以下不属于无监督学习的算法是:...
  • JinbaoSite
  • JinbaoSite
  • 2017年06月09日 23:03
  • 553

【MOOC】Python机器学习应用-北京理工大学 - 【第二周】有监督学习

本周课程导学监督学习的目标利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射关系应用到未知数据上,达到分类或回归的目的。 分类:当输出是离散的,学习任务为分类任务。 回归:当输出是连续的,...
  • linzch3
  • linzch3
  • 2017年07月25日 20:34
  • 1398

Python机器学习应用 | 无监督学习

1 无监督学习利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。 有监督学习和无监督学习的最大区别在于数据是否有标签 无监督学习最常应用的场景是聚类(clustering)和降...
  • JinbaoSite
  • JinbaoSite
  • 2017年06月27日 14:13
  • 1082
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:机器学习基础篇--监督学习经典案例(Python实现)
举报原因:
原因补充:

(最多只允许输入30个字)