<script type="text/javascript" src="//rf.revolvermaps.com/0/0/1.js?i=5ccx59t5xwh&s=350&m=7&v=true&r=false&b=000000&n=false&c=ff0000" async="async"></script>
如果在你浏览的是github里的readme文件,无法查看视频,请点击The School of AI Beijing
- 关于SoAI-About The School of AI
- 学习资料-Learning material
- 开发环境-Dev environment
- 课程列表-Syllabus
- 课程内容-Contents
- 作业汇总-Homework Summary
- 参考资料-References
- 结业答辩-Graduation presentations
- 交流分享-Share
- 合作方-Partner
- An international educational non-profit platform dedicated to studying, teaching and creating AI to help solve the world’s most difficult problems. Our mission is to offer a world-class AI education to anyone on Earth for free.
- Siraj对SoAI的介绍
- 北京分部有中文、英文两个版本,详情:
- 多种方式:本地、云环境,由于不少项目需要GPU支持,建议采用云环境
- 为什么大家都用jupyter notebook?深度学习代码只能在notebook上跑吗?
- 非也,notebook主要用于教学展示,代码分享,工程落地时,必须转成单个的python文件,按照机器学习的基本流程划分文件及目录,常见的结构如下:
- data:数据目录,包含:
- train.txt
- test.txt
- validation.txt(可选)
- bin:核心代码,主要包含:
- model.py:模型定义
- feature.py:特征工程部分,离线训练和在线评估都有
- train.py:模型训练代码
- predict.py:在线预测(inference,推断)
- model:模型存放
- log:日志目录
- 训练日志,如tensorboard日志
- conf:配置文件
- common:公共库、组件
- eva.py:效果评估
- data:数据目录,包含:
- Google colab,与github直接打通,免费GPU(Tesla T4)
- 如果无法访问,建议使用Kaggle,fastai接入指南,从0到1走进kaggle
- 【2019-05-12】kaggle注册时可能收不到验证码,原因是伟大的墙,解决方法:①找个v-p-n②kaggle注册无法激活怎么办
- fastai官方代码库
- 第1课的官方视频,图像分类-需vpn,bilibili-无需vpn,第1课的更新,第一课笔记
- 知识体系(参考第一次课:深度学习入门指南)
- 如何高效学习
- 知乎:为什么大多数人宁愿吃生活的苦,也不愿吃学习的苦?(主动吃苦)
- 学习金字塔:
- 费曼技巧:终极快速学习方法
- 怎么成为大牛?走出舒适区,进入学习区
- 大脑的学习之道:图谱结构+注意力+联想记忆+推理反思
- 数学基础:(选读,如果想深入学习,就必读)
- 线性代数(35%)
- 资料:「Deep Learning」读书系列分享第二章:线性代数-分享总结 【文字版】, 线性代数笔记
- 概率与信息论(25%)
- 资料:「Deep Learning」读书系列分享第三章:概率和信息论-分享总结,【文字版】
- 其他资料:Deep Learning解读合辑-国庆特辑, 视频版
- 线性代数(35%)
- Python生态圈
- numpy, 矩阵运算工具,资料如下:
- pandas,表格数据分析工具,资料如下:
- matplotlib,画图工具,资料如下:
- 机器学习入门:
- 深度学习入门:
- 神经网络讲解【3Blue1Brown优质讲解】,该系列一共4个视频,第一个如下:
- <iframe src="//player.bilibili.com/player.html?aid=15532370&cid=25368631&page=1" scrolling="yes" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>
- 神经网络Web Demo,可在线体验神经网络训练过程
- <iframe src="https://playground.tensorflow.org/" scrolling="yes" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>
- 神经网络3D仿真特效(多种网络结构对比)
- <iframe src="//player.bilibili.com/player.html?aid=13942311&cid=22776951&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>
- 手写数字识别在线体验
Fast.AI系列速成实战课程,时间安排如下:
- 注意:这是github page搭建的主页,如想进入github,请点击“View on Github”,示例如下:
- 历次ppt课件资源
时间-Date | 章节-Chapter | 题目-Topic | 预习资源-Resources | 正式解读-Interpretation | 作业-Homework |
---|---|---|---|---|---|
2019-04-21 | 介绍 | 深度学习入门指南 | 请完成ppt里提到的作业,长期 | 这节课长达2h,内容非常多,覆盖深度学习入门几乎全部知识点 | 完整看完80+页的ppt,并预习第二课 |
2018-04-27 | 第一课 | 宠物图片分类,英文视频,中文版笔记 | Github代码 | 安装fastai环境并动手实现,代码解析:Github本地,Colab,Kaggle | 亲手执行本次代码,熟悉fastai环境 |
2018-05-12 | 第二课 | 特征工程及SGD,英文视频,中文版笔记 | Github代码 | github,colab,kaggle示例 | ①熟悉fastai+kaggle环境②执行scikit-learn代码,github库里,code/lecture_2目录下 ③学完google机器学习速成课速成课(地址见本页面的入门必读) ④预习神经网络fastai第五课-反向传播与神经网络 |
2018-05-* | 第三课 | 多标签分类,英文视频,中文版笔记 | Github代码 | - | 作业 |
2018-05-* | 第四课 | NLP&推荐系统,英文视频,中文版笔记 | Github代码 | - | 作业 |
2018-05-* | 第五课 | 从反向传播到神经网络,英文视频,中文版笔记 | Github代码 | github代码,ppt | 作业 |
2018-05-* | 第六课 | 正则化卷积,英文视频,中文版笔记 | Github代码 | - | 作业 |
2018-05-* | 第七课 | Resnets、GAN等,英文视频,中文版笔记 | Github代码 | - | 作业 |
- | - | - | - | - | - |
最新课程安排见project区,Fastai中文笔记,kaggle中文代码
- 本教程以fastai的速成课为蓝本(注意:需要vpn,如果没有,请往下看,找bilibili上的视频)
- 如有问题,可以去SoAI论坛提问
- 深度学习入门全貌,请仔细看
- 主题:fastai课程的第一课进行讨论:图像分类。
- 时间:于4月27日星期日下午5点举行
- 地点:双清路77号院双清大厦4号楼4层清华数据科学研究院
议程:
- 介绍fastai第1课的必要资源,如何获取fastai的资源
- 学生现场演示第一课作业
- 自由问答, 遇到困难
视频资料:(来自哔哩哔哩)
- <iframe src="//player.bilibili.com/player.html?aid=46252318&cid=81036516&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>
- 作业提交指南
- Homework
- 分线上和线下渠道,将自己的作业整理到github或colab,去project作业汇总区新建自己的卡片
- 也可以去Fast.AI论坛-SoAI区提问
- 【注意】如何在issue中提问
-
iris数据集+机器学习实战
-
CNN简介
- 计算机视觉
- CNN基本结构
-
应用
-
反思
- 时间:2019-06-16
- 中文分支的往期内容及课件,见地址
- 答辩现场,由于学员较多,时间长,从16:00-19:40,衷心感谢各位坚持到最后
- 第一位 邢畅, xingchang, 16:07,学习总结,在地理信息系统里的应用
- 介绍了GIS领域的应用,整理了详细的学习笔记、脑图
- 第二位 张天奇,Tianqi.Zhang,16:27,kaggle比赛,基于新闻语料的股价涨跌预测,Eric Zhang
- 成绩:356/2800, ≈13%,4个人的团队,负责特征工程+多线程实现,xgboost主要负责分类
- 提问:
- xGBoost的原理,既可以用于分类,还可以用于回归
- 代码里将的metric用的是MSE,而xgb导入的是分类器,看似矛盾?
- 第三位 五个人,推荐资料:数学基础张宇36讲,课程内容回顾;
- 蒋宝尚,mnist的python实现,文本分析(大爆炸+华为+五月天)
- 周启红,学术文章关键词提取,学习过程中遇到的坑儿
- 王瑞华,视频汇报
- 第四位 黄安付,17:15,专题报告:fit_one_cycle()详解
- 优化算法,鞍点(saddle point),病态矩阵,粒子群算法
- 提问:动量解释,附加SGD系列优化算法演进,An overview of gradient descent optimization algorithms,How to Escape Saddle Points Efficiently,SGD算法比较,如下图,注意:v是动量部分,g是梯度部分
- 第五位 李靖华,17:36,学习总结
- git,学习方法总结
- 实习经历,4w张图片分类,用代码1天完成,做事情时先别急着动手
- 成功拿到创新工场的实习机会,新人到职场的华丽蜕变
- 总结
- 答辩里的几个技术点可以继续深挖:
- ①sgd各种算法演化,动量和梯度分别对应哪一块?这道题是新手的进阶题,打怪升级的典型门槛
- ②kaggle项目里的矛盾点要必要澄清下,基于新闻预测股价,为什么用xgb分类?特征工程部分可以继续系统化,不满足于简单的数据处理
- ③实习经历里的4w张图像标注任务可以补充描述下,说不定有更好的办法
- 答辩里的几个技术点可以继续深挖:
- 张子涵, I wrote a short article with some doodling on neural networks and how they work. Here is the link if you want to check it out medium文章
- Mohamed Amine Aguir的Convolutional Neural Network
- Nabil Affo的Uber ride评论分类项目,jupyter代码, Medium文章Loss functions in machine learning and deep learning
- Alexander R Kivaisi, Categorizing Soccer Teams(代码见资料汇总区), Medium文章Data Augmentation
- Min Wang(汪敏)
- Yuanyuan,CFAIR-10图像分类
- 部分学员的答辩整理已收集到目录, 欢迎大家积极分享自己的资料,共同学习,添加方式,回复本帖
- Part of the resources have been collected to this address, it's recommended to share your own ppt/code/post here by reply bellow, learn from each other
- 大部分基础知识以及扩展资料都在之前的课程ppt中,多看SoAI主页The School of AI Beijing,毕业了并不代表学完了,或者真的学好了,请大家有空多温习,少走弯路
欢迎大家入群分享、交流!
- Fast.AI论坛-SoAI北京区(英文为主)
- The School of AI 北京中文版 QQ群, 王奇文, 联系我?[email protected], qq: 547243068
- 大数据文摘+清华数据科学院研究院
- 举办地点:清华大学
- 时间:每周末一次,如想参加,请先文摘助手微信,往期海报如下:
<iframe src="https://ghbtns.com/github-btn.html?user=wqw547243068&repo=school-of-ai-beijing&type=watch&count=true&size=large" allowtransparency="true" frameborder="0" scrolling="0" width="156px" height="30px"></iframe> <iframe src="https://ghbtns.com/github-btn.html?user=wqw547243068&repo=school-of-ai-beijing&type=fork&count=true&size=large" allowtransparency="true" frameborder="0" scrolling="0" width="156px" height="30px"></iframe> --- <script type="text/javascript" src="//rf.revolvermaps.com/0/0/1.js?i=5ccx59t5xwh&s=350&m=7&v=true&r=false&b=000000&n=false&c=ff0000" async="async"></script> --- <script> window._bd_share_config={"common":{"bdSnsKey":{},"bdText":"鹤啸九天的技术博客","bdMini":"2","bdMiniList":false,"bdPic":"http://news.zx123.cn/uploadfile/news68/1800961ad02811e7b1c400163e010ef1.jpg","bdStyle":"0","bdSize":"32"},"share":{},"image":{"viewList":["qzone","tsina","tqq","renren","weixin"],"viewText":"分享到:","viewSize":"32"},"selectShare":{"bdContainerClass":null,"bdSelectMiniList":["qzone","tsina","tqq","renren","weixin"]}};with(document)0[(getElementsByTagName('head')[0]||body).appendChild(createElement('script')).src='http://bdimg.share.baidu.com/static/api/js/share.js?v=89860593.js?cdnversion='+~(-new Date()/36e5)]; </script>
<script type="text/javascript">
(function(d, s) {
var j, e = d.getElementsByTagName(s)[0];
if (typeof LivereTower === 'function') { return; }
j = d.createElement(s);
j.src = 'https://cdn-city.livere.com/js/embed.dist.js';
j.async = true;
e.parentNode.insertBefore(j, e);
})(document, 'script'); </script> 为正常使用来必力评论功能请激活JavaScript
<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?1da5e6aa58efde9ff55242aece940f6a"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>
<script async src="https://www.googletagmanager.com/gtag/js?id=UA-139247575-2"></script> <script> window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'UA-139247575-2'); </script>