Python科学计算和数据科学应用([美]罗伯特.约翰逊RobertJohansson,黄强)

书: https://pan.baidu.com/s/1o53U8DJYBlzPKes4X47C8Q?pwd=ymj8
笔记如下:

  1. “NumPy的ndarray是科学计算的基石,矢量化运算比Python循环快100倍。”
  2. “SciPy的scipy.optimize.minimize实现非线性优化,scipy.integrate.quad计算数值积分。”
  3. “Pandas的DataFrame.query()用字符串表达式过滤数据,比布尔索引更简洁。”
  4. pd.merge_asof()对非精确匹配的时间序列数据执行‘最近邻’合并。”
  5. “Matplotlib的面向对象API:fig, ax = plt.subplots()明确控制图形和坐标轴。”
  6. “Seaborn的FacetGrid实现多面板分面绘图,pairplot自动探索特征关系。”
  7. “SymPy符号计算:x = symbols('x')定义符号变量,diff(sin(x), x)求导。”
  8. “Scikit-learn的Pipeline将特征转换、降维和模型训练封装为统一流程。”
  9. GridSearchCV自动化超参数搜索,RandomizedSearchCV适合高维参数空间。”
  10. “Dask并行处理大于内存的数据集,API设计与NumPy/Pandas高度兼容。”
  11. statsmodelsOLS类实现线性回归,summary()输出统计显著性和R²。”
  12. “交互式可视化:Plotly的express模块三行代码生成动态图表。”
  13. scipy.sparse处理稀疏矩阵,csr_matrix优化存储和计算效率。”
  14. pd.eval()numexpr加速复杂表达式计算,避免中间变量内存开销。”
  15. scipy.fftpack实现快速傅里叶变换(FFT),分析信号频域特征。”
  16. sklearn.decomposition.NMF(非负矩阵分解)用于文本主题提取和图像特征学习。”
  17. xarray处理带标签的多维数组(如气候数据),支持高级索引和聚合。”
  18. “Jupyter Notebook的%%timeit魔法命令测量代码片段执行时间。”
  19. “科学计算黄金法则:始终验证数值方法的稳定性(如检查矩阵条件数)。”
  20. “数据科学工作流:探索(EDA)→假设→建模→验证→迭代,可视化贯穿始终。”

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注