Data Analysis Python Engine
by Joker
Analysis scene routing, Python toolchain, data cleaning SOP, visualization, ML pipeline, 2026 trends.
Free
Sample input
Help with data
Sample output
Data Analysis Python Engine
Structured analysis with routing and next steps.
Data Analysis Python Engine
by Joker
Analysis scene routing, Python toolchain, data cleaning SOP, visualization, ML pipeline, 2026 trends.
Free
Included in download
- Downloadable skill package
- 1 permission declared
- Instant install
Sample input
Help with data
Sample output
Data Analysis Python Engine
Structured analysis with routing and next steps.
Screenshots
About This Skill
# 数据分析Python实战引擎 (data-analysis-python-engine) > 专家级Python数据分析实战指南 | 覆盖全场景全流程 | 持续迭代至2026年 --- ## 一、核心定位 本技能为Python数据分析提供从需求诊断到代码交付的全链路实战指导,聚焦于**真实业务场景**的**可落地代码**。无论你是数据新人还是进阶分析师,都能找到即学即用的解决方案。 **使用原则**:先诊断场景类型,再匹配工具链,最后执行标准化SOP。 --- ## 二、分析场景路由 ### 2.1 六大核心场景快速定位 ### 2.2 场景特征与选择指南 | 场景 | 核心问题 | 典型数据特征 | 输出形式 | 常用工具 | |------|----------|--------------|----------|----------| | **探索性分析(EDA)** | "数据是什么样的?" | 维度多、关系复杂 | 描述统计、可视化图表 | Pandas, SweetViz | | **预测建模** | "下一个X是什么?" | 标签明确、结构化 | 模型+预测结果 | Scikit-learn, XGBoost | | **A/B测试** | "哪个方案更好?" | 随机分组、有对照 | 统计显著性报告 | SciPy, StatsModels | | **用户行为分析** | "用户怎么用的?" | 事件流、时序数据 | 漏斗图、留存表 | Pandas, Plotly | | **文本分析** | "文本说了什么?" | 非结构化文本 | 主题、情感、关键词 | NLTK, transformers | | **时序分析** | "未来趋势如何?" | 带时间戳数据 | 预测值、置信区间 | Prophet, statsmodels | ### 2.3 场景选择决策树 --- ## 三、Python工具链决策 ### 3.1 核心工具矩阵 ### 3.2 工具选择决策树 ### 3.3 数据加载工具箱 ### 3.4 性能基准测试代码 --- ## 四、数据清洗实战SOP ### 4.1 标准清洗流程图 ### 4.2 缺失值处理SOP ### 4.3 异常值检测SOP ### 4.4 特征工程模板 --- ## 五、可视化方案 ### 5.1 工具选择决策矩阵 ### 5.2 场景-图表匹配表 | 分析目的 | 推荐图表 | 工具选择 | 示例代码 | |----------|----------|----------|----------| | 分布查看 | 直方图/KDE | Matplotlib/Seaborn | `sns.histplot()` | | 相关性分析 | 热力图/散点图 | Seaborn | `sns.heatmap()` | | 趋势变化 | 折线图 | Matplotlib/Plotly | `px.line()` | | 类别对比 | 柱状图/饼图 | Matplotlib | `plt.bar()` | | 多维数据 | 雷达图/树图 | Plotly/Echarts | `px.scatter_matrix()` | | 地理数据 | 地图 | Pyecharts | `geo.add()` | | 关系网络 | 力导向图 | Pyecharts | `graph.add()` | | 漏斗分析 | 漏斗图 | Pyecharts | `funnel.add()` | ### 5.3 标准化可视化模板 --- ## 六、机器学习管线 ### 6.1 算法选择决策树 ### 6.2 Scikit-Learn 标准Pipeline ### 6.3 XGBoost/LightGBM 调参指南 --- ## 七、用户行为分析实战 ### 7.1 漏斗分析SOP ### 7.2 留存分析SOP ### 7.3 RFM分析SOP --- ## 八、2026年趋势展望 ### 8.1 AI与数据分析融合趋势 ### 8.2 新兴工具与框架 | 趋势 | 工具/框架 | 适用场景 | 学习优先级 | 入门难度 | |------|-----------|----------|------------|----------| | **对话式数据分析** | LangChain + SQL | 自然语言查询数据库 | ★★★★★ | ★★★☆☆ | | **MLOps自动化** | MLflow, W&B | 模型生命周期管理 | ★★★★☆ | ★★★☆☆ | | **特征平台** | Feast, Hopsworks | 特征存储与复用 | ★★★☆☆ | ★★★★☆ | | **指标层** | dbt, MetricFlow | 业务指标定义 | ★★★★☆ | ★★☆☆☆ | | **内存计算** | Apache Arrow, Ballista | 分布式计算 | ★★★☆☆ | ★★★★☆ | | **因果推断** | DoWhy, EconML | 因果关系分析 | ★★★☆☆ | ★★★★★ | | **实时分析** | Apache Kafka, Flink | 流式数据处理 | ★★★★☆ | ★★★★★ | ### 8.3 2026年技能升级路径 ### 8.4 AI辅助分析工作流 --- ## 九、质量门控清单 ### 9.1 三级质量标准 ### 9.2 质量检查清单模板 --- ## 十、常见错误模式 ### 10.1 Top 10 数据分析错误 ### 10.2 错误诊断与修复代码 --- ## 附录A:常用代码模板速查 ## 附录B:常用库导入速查 ## 附录C:参考资源 | 资源类型 | 推荐资源 | URL | |----------|----------|-----| | Pandas官方文档 | Pandas User Guide | [URL removed] | | Scikit-learn | User Guide | [URL removed] | | Kaggle | Learn | [URL removed] | | Python书籍 | Python Data Science Handbook | [URL removed] | | 统计学习 | ISLR (英文) | [URL removed] | | 可视化 | Matplotlib Gallery | [URL removed] | --- ## 版本历史 | 版本 | 日期 | 更新内容 | |------|------|----------| | 1.0 | 2026-01 | 初始版本发布 | | 1.1 | 2026-02 | 新增RFM分析SOP、留存分析、漏斗分析 | | 1.2 | 2026-03 | 新增AI辅助分析工作流、2026趋势更新 | --- *本技能持续更新中,如有问题请提供具体场景描述*
How to Install
mkdir -p ~/.claude/skills && curl -sL https://www.agensi.io/api/install/data-analysis-python-engine -o /tmp/data-analysis-python-engine.zip && unzip -o /tmp/data-analysis-python-engine.zip -d ~/.claude/skills && rm /tmp/data-analysis-python-engine.zipFree skills install directly. Paid skills require purchase - use the download button above after buying.
Reviews
No reviews yet - be the first to share your experience.
Only users who have downloaded or purchased this skill can leave a review.
No reviews yet - be the first to share your experience.
Only users who have downloaded or purchased this skill can leave a review.
Security Scanned
Passed automated security review
Permissions
File Scopes
No API needed
Creator
Frequently Asked Questions
Learn More About AI Agent Skills
More Premium Skills
designing-hybrid-context-layers
Architects the right retrieval strategy for every query — teaching your agent when to use RAG, a knowledge graph, or a temporal index instead of defaulting to vector search for everything.
ai-automation-qa-pack
Professional QA & UAT documentation generator for AI automation agencies and complex agent deployments.
Bounty Security Pattern Master Library — 399 Vulnerability Patterns
A premium library of 399 vulnerability patterns and DeFi attack vectors for AI-driven bug hunting and security audits.
keyword-research
Transform URLs or product lists into SEO keyword research packs with Google Ads data and intent-based clustering.