爬了知乎200万数据,图说程序员都喜欢去哪儿工作~

原创 2017年11月26日 00:00:00

因为最近和朋友吃饭,大家都到了大三季,都在纠结自己该以哪里作为自己职业发展的起点?也想看看自己的背景,能不能找到靠谱的师哥师姐帮忙,那么师哥师姐都在哪里发光发亮呢?


我当时也是午休的时候想到,知乎有那么多结构化的好的数据,不如抓取之,拿来分析可以看看名校生们都在哪?


我们行业的人都喜欢哪,哪里每年带走一堆人?


然后花半小时写了个多线程爬虫,爬下来几百万数据(其中每个学校的大圆圈占比代表该校学生在调研总数中的占比)


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg


这次抓取的数据量有将近200万,跑了一个下午,然后我把没有公司或者教育学校的筛掉,就还剩25万了~



点击图片get更多精彩

0?wx_fmt=png

前方高能 | 你写过什么有趣的程序?最后一个笑出猪叫


0?wx_fmt=png

鉴别一个人是否 js 入门的标准竟然是?!


0?wx_fmt=png

为什么不能和程序媛谈恋爱?


0?wx_fmt=gif

640?wx_fmt=png

版权声明:本文为博主原创文章,未经博主允许不得转载。

爬了知乎200万数据,图说程序员都喜欢去哪儿工作

因为最近和朋友吃饭,大家都到了大三季,都在纠结自己该以哪里作为自己职业发展的起点?也想看看自己的背景,能不能找到靠谱的师哥师姐帮忙,那么师哥师姐都在哪里发光发亮呢? 我当时也是午休的时候想到,知...
  • sfM06sqVW55DFt1
  • sfM06sqVW55DFt1
  • 2017年11月29日 00:00
  • 121

爬了知乎 200 万数据,图说程序员都喜欢去哪儿工作

点击上方“CSDN”,选择“置顶公众号” 关键时刻,第一时间送达! 因为最近和朋友吃饭,大家都到了大三季,都在纠结自己该以哪里作为自己职业发展的起点?也想看看自己的背景,能不能找到靠谱的师...
  • csdnnews
  • csdnnews
  • 2017年12月03日 00:00
  • 2871

程序员喜欢怎样的职位描述?

在程序员招聘的过程中,公司本身的状况和招聘职位是非常关键的因素。如果招聘的是 BAT 的关键职位,HR 们不需要花费太多心思,就能轻松斩获数量充裕的高水平简历。但如果是创业公司,名气不是非常大,招聘的...
  • u011225629
  • u011225629
  • 2015年06月24日 16:57
  • 761

如何快速定位自己热爱的工作

你喜不喜欢软件开发?不喜欢的话怎么找到你热爱的其它工作?提供一个行之有效实战方法,快速找到定位。...
  • foruok
  • foruok
  • 2015年10月26日 07:16
  • 8107

爬取知乎的一些思路

简介:在之前的一个爬取知乎问题和答案的项目中遇到了许许多多的问题,写下此篇文章作为总结和回顾项目文章:/sinat_34200786/article/detai...
  • sinat_34200786
  • sinat_34200786
  • 2017年11月18日 21:09
  • 327

【Python数据分析】简单爬虫,爬取知乎神回复

看知乎的时候发现了一个 “如何正确地吐槽” 收藏夹,里面的一些神回复实在很搞笑,但是一页一页地看又有点麻烦,而且每次都要打开网页,于是想如果全部爬下来到一个文件里面,是不是看起来很爽,并且随时可以看到...
  • qq_37267015
  • qq_37267015
  • 2017年05月08日 08:54
  • 1177

爬取知乎60万用户信息之后的简单分析

使用 Java+Elasticsearch+Kibana 爬取了知乎 60 万用户数据,做了简单的可视化分析。...
  • h3243212
  • h3243212
  • 2016年12月20日 23:52
  • 1452

php爬虫:知乎用户数据爬取和分析

转载自:http://segmentfault.com/a/1190000004357994 背景说明:小拽利用php的curl写的爬虫,实验性的爬取了知乎5w用户的基本信息;同时,针对爬取...
  • u012377333
  • u012377333
  • 2016年01月28日 13:21
  • 3189

Python爬虫爬取知乎小结

博客首发至Marcovaldo’s blog (http://marcovaldong.github.io/)最近学习了一点网络爬虫,并实现了使用python来爬取知乎的一些功能,这里做一个小的总结。...
  • MajorDong100
  • MajorDong100
  • 2016年08月20日 23:03
  • 15691

爬取张佳玮138w+知乎关注者:数据可视化

作为博客上第一篇文章,先介绍下小背景,即为什么爬知乎第一大V张公子的138w+关注者信息? 其实之前也写过不少小爬虫,按照网上各种教程实例去练手,“不可避免”的爬过妹子图、爬过豆瓣Top250电影...
  • Deserts_X
  • Deserts_X
  • 2017年07月31日 07:46
  • 2270
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:爬了知乎200万数据,图说程序员都喜欢去哪儿工作~
举报原因:
原因补充:

(最多只允许输入30个字)