
书: https://pan.baidu.com/s/1o53U8DJYBlzPKes4X47C8Q?pwd=ymj8
笔记如下:
- “NumPy的
ndarray
是科学计算的基石,矢量化运算比Python循环快100倍。” - “SciPy的
scipy.optimize.minimize
实现非线性优化,scipy.integrate.quad
计算数值积分。” - “Pandas的
DataFrame.query()
用字符串表达式过滤数据,比布尔索引更简洁。” - “
pd.merge_asof()
对非精确匹配的时间序列数据执行‘最近邻’合并。” - “Matplotlib的面向对象API:
fig, ax = plt.subplots()
明确控制图形和坐标轴。” - “Seaborn的
FacetGrid
实现多面板分面绘图,pairplot
自动探索特征关系。” - “SymPy符号计算:
x = symbols('x')
定义符号变量,diff(sin(x), x)
求导。” - “Scikit-learn的
Pipeline
将特征转换、降维和模型训练封装为统一流程。” - “
GridSearchCV
自动化超参数搜索,RandomizedSearchCV
适合高维参数空间。” - “Dask并行处理大于内存的数据集,API设计与NumPy/Pandas高度兼容。”
- “
statsmodels
的OLS
类实现线性回归,summary()
输出统计显著性和R²。” - “交互式可视化:Plotly的
express
模块三行代码生成动态图表。” - “
scipy.sparse
处理稀疏矩阵,csr_matrix
优化存储和计算效率。” - “
pd.eval()
和numexpr
加速复杂表达式计算,避免中间变量内存开销。” - “
scipy.fftpack
实现快速傅里叶变换(FFT),分析信号频域特征。” - “
sklearn.decomposition.NMF
(非负矩阵分解)用于文本主题提取和图像特征学习。” - “
xarray
处理带标签的多维数组(如气候数据),支持高级索引和聚合。” - “Jupyter Notebook的
%%timeit
魔法命令测量代码片段执行时间。” - “科学计算黄金法则:始终验证数值方法的稳定性(如检查矩阵条件数)。”
- “数据科学工作流:探索(EDA)→假设→建模→验证→迭代,可视化贯穿始终。”