data analyst portfolio

万南天· 数据分析作品集

金融工程专业学生,聚焦业务数据分析。习惯从一个数字异常出发——voucher 支付取消率是信用卡的 25 倍,然后一路追到逻辑回归验证它不是混淆变量的假象。

当前共 3 个项目:1 个覆盖经营分析与风险建模的完整项目、1 个 A/B 实验分析项目、1 个 AI 辅助求职工具。

projects

项目作品

三个项目分别覆盖业务经营分析 + 因果建模、实验设计与双框架检验、AI 工程落地。点击进入详情页,含完整结论、方法与代码片段。

主项目 · 经营分析 + 因果建模

Olist 电商分析

全链路经营分析 + 取消风险建模,从 SQL 数据提取到 Logit 交互效应验证的完整分析链路

SQLPythonPower BIstatsmodels
  • GMV R$ 1542 万,9.6 万订单,8 个 SQL 模块 + 6 张 Power BI 仪表板
  • 78,126 条建模样本,三层证据链:Fisher OR=31.55 / Voucher OR=1.39 / 交互项 OR=1.09
  • 从描述性发现出发,逻辑回归控制混淆变量,交互项验证组合放大效应

核心发现:高客单订单中 voucher 支付取消风险被显著放大,建议针对该组合优化支付引导策略。

R$ 1542 万
GMV
9.6 万
订单数
78,126
建模样本
31.55
Fisher OR
1.39
Voucher OR
1.09
交互项 OR
月度成交额与订单量
实验分析 · 双框架检验

Cookie Cats A/B 测试分析

9 万用户行为数据,频率派 + 贝叶斯双框架评估付费门位置对 7 日留存率的影响

PythonscipyBeta-Binomial
  • 90,189 用户,gate_30 vs gate_40 两组,含 SRM 分流合理性验证
  • 7 日留存频率派 p=0.0016,贝叶斯 P(gate_30 > gate_40)=99.92%,双框架结论一致
  • 效应量解释:行业 7 日留存基准约 15-18%,1% 量级提升具有业务意义

建议结论:维持 gate_30 方案,双框架一致支持,推迟付费门会显著损害 7 日留存。

9 万
用户数
2 组
实验分组
0.0016
7日留存 p值
99.92%
贝叶斯概率
双框架
频率派+贝叶斯
不上线
建议结论
7 日留存率对比
工程项目 · AI 工具落地

Job Hunter 求职自动化工具

爬取职位数据 + LLM 智能打分 + Streamlit 交互看板,一套完整的 AI 辅助求职 pipeline

PythonLLMStreamlitPandas
  • scraper 自动抓取职位列表,analyzer 调用 LLM 对每条 JD 评分并生成推荐理由
  • 923 条职位数据,按城市、匹配度区间、投递状态三维筛选
  • 从 0 到可用产品单日完成,使用 Claude Code 辅助开发全程

核心价值:把筛选 JD 的时间从数小时压缩到分钟级,LLM 打分替代人工逐条阅读。

923
抓取职位数
3层
筛选维度
1天
开发周期
LLM
智能打分
自动化
全流程
Streamlit
交互看板
求职追踪看板

about

关于我

金融工程专业 2028 届。求职方向为业务数据分析,对电商、金融场景下的指标拆解、用户分群与因果验证最感兴趣。目前持续通过项目打磨 SQL 与 Python 的分析能力,并尝试把描述性分析延伸到建模验证。近期探索 AI 工具在实际工作流中的落地应用,使用 Playwright + LLM API 构建了完整的求职自动化 pipeline。

作品集中所有项目均已开源。如对项目细节、SQL 写法或建模思路有兴趣,欢迎前往 GitHub 直接查看完整代码。

技术栈
数据提取
SQL(MySQL)、CTE、窗口函数、多表 JOIN
分析与建模
Python、Pandas、statsmodels(Logit)、scipy(z-test、Fisher)
实验分析
A/B 测试、频率派检验、贝叶斯推断(Beta-Binomial)
可视化
Power BI、Matplotlib、Seaborn

contact

寻找业务数据分析实习机会

2028 届金融工程在读,求职方向业务数据分析。行业不限,一线城市优先。暑期(6–9 月)可全勤到岗,学期内可工作日远程协作。

如对作品集中任一项目感兴趣,或有合适的实习机会,欢迎通过下方任一方式联系。

联系方式
💬
微信
wnt0801