本人依据个人爱好和工作需要制定了一份详细的学习计划。依据本「指南」在博客不定时更新学习笔记,尝试用费曼学习法深刻理解所学的知识。

其中

  • 标记 ☑️ 是必修
  • 标记 ⬜️ 待定
  • 标记 ❤️ 是选修课

致谢,ApacheCN 中文开源组织: 致力于官方文档及AI书籍中文翻译。

标点符: 丰富的机器学习理论知识和Python示例。

Basics

Markup Language

Blog

Artificial Intelligence

Machine Learning

Deep Learning

  • ☑️ 多层感知机(MLP)
  • ☑️ 卷积神经网络(CNN): 特别适用于图像处理任务
  • ☑️ 循环神经网络(RNN): 适用于处理序列数据,如时间序列分析和自然语言处理
  • ☑️ 长短期记忆网络(LSTM): 一种特殊的RNN架构,有效解决了传统RNN中的梯度消失问题
  • ☑️ 生成对抗网络(GAN): 用于生成逼真的图像等数据
  • ☑️ 强化神经网络(DQN)

Large Language Model

  • ⬜️ Generative AI: AI Generated Content (AIGC)
  • ⬜️ Transformer
  • ⬜️ Generative Pre-trained Transformer (GPT)

Appendices

Big Data

Hadoop

Hive

  • ☑️ Hive安装配置
  • ☑️ Hive基础知识
  • ☑️ HiveQL(Introduction): Hive 命令、数据类型
  • ☑️ HiveQL(DQL): 数据查询语言(Data Query Language, DQL):用以从表中获得数据,包括 SELECT,WHERE,ORDER BY,GROUP BY和HAVING等。
  • ☑️ HiveQL(DML): 数据操作语言(Data Manipulation Language, DML):其语句包括动词 INSERT、UPDATE、DELETE。它们分别用于添加、修改和删除。
  • ☑️ HiveQL(DDL): 数据定义语言(Data Definition Language, DDL):其语句包括动词CREATE、ALTER和DROP。
  • ☑️ HiveQL(Functions): Hive 常用函数

Spark

Oracle

  • ☑️ Oracle SQL(Introduction)
  • ☑️ Oracle SQL(DQL): 数据查询语言(Data Query Language, DQL):用以从表中获得数据,包括 SELECT,WHERE,ORDER BY,GROUP BY和HAVING等。
  • ☑️ Oracle SQL(DML): 数据操作语言(Data Manipulation Language, DML):其语句包括动词 INSERT、UPDATE、DELETE。它们分别用于添加、修改和删除。
  • ☑️ Oracle SQL(DDL): 数据定义语言(Data Definition Language, DDL):其语句包括动词CREATE、ALTER和DROP。
  • ☑️ Oracle SQL(Functions): Oracle 常用函数
  • ☑️ Oracle SQL(TCL): 事务控制语言(Transaction Control Language, TCL):它的语句能确保被DML语句影响的表的所有行及时得以更新。包括COMMIT(提交)命令、SAVEPOINT(保存点)命令、ROLLBACK(回滚)命令。

Appendices

  • ❤️ Dask: 是一个灵活的开源库,适用于 Python 中的并行和分布式计算
  • ☑️ Flink安装配置: Flink是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。
  • ☑️ Kafka安装配置: Kafka 是一种分布式的,基于发布 / 订阅的消息系统,支持数据集成和数据流处理。
  • ⬜️ Presto 简介: 设计用于对 HDFS 和其他源中的数据进行快速交互式查询。对于多表关联的需求,我们可以通过 Presto 跨数据源完成多表的 join 操作。
  • ⬜️ ClickHouse: 是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。对于固定类报表,可以将数据打平成宽表的,充分发挥在单表查询的性能优势。
  • ⬜️ StarRocks: 致力于全场景联机分析(OLAP)统一服务。采用了全面向量化引擎(列存储)。可以接收批量或者流式数据存储,也可以在数据湖上直接使用 StarRocks 分析。
  • ⬜️ Kylin: 的核心思想是以空间换时间。即多维分析可能用到的度量进行预计算,将计算好的结果保存成Cube并存储到HBase中,供查询时直接访问。

Python

本手册所列包来自Awesome-Python ,结合GitHub 和官方文档。

Basics

Standard Library

Scientific Computing

Data Analysis

Web Crawling

Visualise

Machine Learning

Deep Learning

  • ⬜️ TensorFlow: Google开源的深度学习框架。
  • ☑️ PyTorch: Facebook研发的专门针对 GPU 加速的深度学习框架。

Documentation

  • ☑️ Python(Documentation)–PyYAML: Python 的 YAML 解析器和发射器
  • ⬜️ python-docx: for creating and updating Microsoft Word (.docx) files.
  • ❤️ openpyxl: 全面,包括修改各种Excel格式,不过不能批量修改数据
  • ⬜️ xlwings: 批量实时修改Excel数据,和pandas, matplotlib完美对接,只能修改个别格式
  • ❤️ markdown: 用于将Markdown文本转换为HTML或其他格式。

Learning Python


Java

Basics


C++

Basics

Machine Learning


R

本手册所列包基本来自AwesomeR ,结合GitHubhelp(package="pk_name")官方文档整理所得,有助于使用时下最实用的包对R进行深入的学习。

Basics

Import

  • ☑️ R(Import)–读取常用文件: for txt, excel, and json
  • ⬜️ haven: for SPSS,SAS and Stata files.(Hadley)
  • ❤️ feather: for sharing with Python and other languages.(Hadley)
  • ☑️ R(Import)–DBI: definition for communication between R and RDBMSs

Web Technologies

  • ☑️ httr: for web APIs (RCurl升级版) (Hadley) (Update according to GitHub)
  • ☑️ R(Import)–rvest: Simple web scraping for R (Hadley)

Data Cleaning

Visualise

Parallel Computing

Machine Learning

  • ☑️ R(Machine Learning)–mlr: 机器学习(分类,回归,生存分析,聚类等)的可扩展框架,提供了用于分析的整套工具,包括重抽样,缺失值插补,模型评估(cv,etc),超参数调优(grid-search,etc),特征选择,可视化(ROC,learnning-curve,etc)等
  • ☑️ R(Model Tools)–broom: Convert statistical analysis objects into tidy format
  • ☑️ R(Model Tools)–modelr: 辅助管道建模
  • ❤️ caret: 分类和回归问题的数据训练综合工具包(包括交叉验证,网格搜索等)
  • ☑️ R(Time Series)–zoo: zoo是对日期型数据进行清洗的R包
  • ☑️ R(Time Series)–forecast and prophet: 线性或非线性模型高质量时间序列预测

NLP

  • ☑️ R(NLP)–jiebaR: R语言词云和中文词典包
  • ☑️ R(NLP)–wordcloud2: R interface to wordcloud for data visualization
  • ☑️ R(NLP)–text2vec: 这个 R 包提供了高性能和简洁的 API 来进行文本分析、自然语言处理(jiebaR推荐包)

Documentation

Learning R


Mathematics

Awesome Math: A curated list of awesome mathematics resources.

基础数学

微分方程

现代数学

  • ☑️ 线性代数(上册): 本文从线性变换出发理解线性代数的本质
  • ☑️ 线性代数(下册): 线性空间和内积、特征值与特征向量、二次型与合同、矩阵分解等
  • ☑️ 线性代数摘要
  • ☑️ 抽象代数: (又称近世代数) 群论、环论、伽罗瓦理论等
  • ❤️ 变分原理: 研究的是一般无穷维的带有一定拓扑的线性空间
  • ❤️ 一般拓扑学: 也称点集拓扑学,主要研究拓扑空间以及定义在其上的数学结构的基本性质
  • ⬜️ 微分拓扑: 微分流形和可微映射
  • ❤️ 微分几何初步: 包括曲线和曲面论、外微分形式和活动标架、黎曼几何

附录

Physics

Awesome Physics: 🌌 A collaborative list of awesome software for exploring Physics concepts. Feel free to contribute!

  • 《物理手册》: (斯托克)这本物理手册系统介绍了当代物理学的各种基本概念、定理、定律以及各种有用的实验方法,并收进了大量最新科学研究成果。
  • Cambridge Notes: 剑桥笔记

基础物理

  • ☑️ 大学物理学: 包括力学,热学,光学,电磁学,原子物理
  • ☑️ 理论力学: 静力学、运动学与动力学
  • ☑️ 电动力学: 电磁现象的经典动力学理论,包括狭义相对论
  • ☑️ 统计力学: 热力学与统计物理
  • ☑️ 量子力学: 研究物质世界微观粒子运动规律的物理学分支
  • ☑️ 原子物理: 研究原子的结构、运动规律及相互作用,是承接经典物理和量子力学的桥梁
  • ❤️ 天体物理

高等物理

  • ☑️ 高等量子力学: 以五条基本公理和测量公理作为出发点,推出量子力学中解释的所有现象
  • ☑️ 高等统计力学: 使用量子力学的语言,讲述量子统计物理的基本原理及其应用
  • ☑️ 量子场论: 量子力学、狭义相对论和经典场论相结合的物理理论
  • ☑️ 广义相对论: 是描述物质间引力相互作用的理论
  • ☑️ 量子引力: 想要把广义相对论量子化,进而统一包括引力在内的四种基本力。

附录


评论
avatar
Tiny Lei
每天进步一点点...
公告
感谢访问本站,若喜欢请收藏^_^
最新文章
网站资讯
文章数目 :
179
已运行时间 :
本站总字数 :
797.8k
本站访客数 :
本站总访问量 :
最后更新时间 :