求职简历 · 深圳

谭程俊

AI 数据工程师 · 数据中台 × Agent 开发 · 12 年数据平台经验
🎯 求职方向:数据中台 Agent 开发(首选)|大数据开发 / 数仓建模(可胜任)
男 · 35 岁 📱 16680435338 📧 2442972114@qq.com 💰 期望 30-35K
个人优势
结合 AI 与大模型数据工程,以数据中台 / 数仓底座为锚点,在其上搭建可审计、可校验的 Agent 与 RAG 应用层,为企业智能化赋能。
  • 金融 AI 风控实战:主导东亚银行金融 AI 风控项目,带领 4 人小组落地财务文本解析引擎;BERT 微调工程化,搭建推理数据预处理管道,对接 Moodys 风控系统实现「结构化数据 + 大模型文本特征」,保障 IFRS9 合规。
  • 实时数仓与数据中台:精通 ODS→DWD→DWS→ADS 分层架构,熟练 Flink CDC、DataX 构建 TB 级同步管道;参与金蝶云 AI 数据中台建设,多租户并发任务指标计算准确率 99%。
  • 技术创新与权威背书:持有数据治理国家专利(CN114331097A),协助团队获国家工信部嘉奖;开发 AHP 一致性检验脚本,解决指标权重逻辑矛盾,支撑金蝶指数体系落地。
专业技能

② RAG / 大模型工程

BERT/GPT 微调 · 向量检索 · OCR 文档解析 · 多模型路由(Qwen / DeepSeek / GPT)· Prompt Engineering · 规则 + AI 融合风控

PyTorchTesseractSentence-TransformersDashScopeOpenAI Functions

③ 传统大数据数仓(保底)

Hive 分层 · Spark Streaming · Kafka · HBase · 用户画像与指标体系建设 · 数据治理(血缘 / 质量 / 元数据)

HiveSparkKafkaHBaseRedisAirflowFineReport

④ Python 数据工程 & 其他

Pandas / NumPy / SQLAlchemy · PyMuPDF / OpenPyXL · GitLab CI/CD · Linux(Nginx/Docker)· 粤语精通 · C1E 驾照

工作经历
深圳市洲明科技股份有限公司
2025.11 – 至今
高级数据开发工程师 · AI 组应用方向核心成员
基于 StarRocks 3.3 实时数仓,支撑订单、生产到财务全链路数据智能化;将 RAG、Agent、知识库与业务场景结合,构建自主分析解决问题的智能应用。
  • RAG 知识库:基于 LangChain 整合 SAP/CRM 核心数据,完成清洗与向量化;Demo 支持产品规格、大客户订单等自然语言查询;独立部署 Dify 向量知识库处理制度/报销/IT 支持等非结构化信息。
  • Agent PoC:设计 Agent 工作流,开发 get_order_status(SAP 订单查询)、find_customer_info(CRM 客户拉取)等原子 Skill,编排展示跨系统自动处理潜力。
  • 技术栈:Python, LangChain, StarRocks, Flink, Kafka, MySQL, SAP/CRM/PLM/OA/SRM/WMS/MES 系统集成。
深圳市迪辉商业软件技术有限公司(东亚银行项目)
2024.04 – 2025.08
数据开发 · AI 风控组长(4 人小组)
  • 配合东亚银行需求,主导 GPT 系列大模型在财务文本解析场景工程化落地,对接 Moodys 风控系统。
  • 基于 BERT 微调解析审计意见、附注文本,提取异常表述、潜在负债等风险信息,补充信用评分模型特征。
  • 梳理银行数仓数据流,设计科目编码转换规则,主导「结构化数据 + 大模型文本特征」向 Moodys 迁移,解决历史数据兼容问题。
  • 自动化数据提取与处理,保障 IFRS9 会计准则合规,提升准确性与效率。
技术栈:Java, Python, GPT, BERT, SQL, DataX, Moodys 接口, 数据治理
金蝶软件(中国)有限公司
2019.04 – 2024.03
数据开发 · 云 AI 数据中台
  • Flink CDC 实现 MySQL/Oracle 实时同步,构建稳定高效采集管道;集成 LangChain 增强平台 AI 能力。
  • 参与金蝶云 AI 数据中台建设,负责 ODS→DWD→DWS→ADS 分层建模与 ETL;主导多级指标体系,开发 AHP 一致性检验脚本校验权重逻辑矛盾。
  • 规则分类预编译、规则配置解析、分布式调度保障多租户并发;适配租户端轻量化 CSV 模板提交规则。
  • 数据治理实践获国家专利(CN114331097A),协助团队获国家工信部嘉奖。
技术栈:Flink, Flink CDC, LangChain, Java, Python, Hive, Spark, Kafka, DataX, Doris, DataWorks
康美大健康科技有限公司
2017.02 – 2019.02
数据开发
基于腾讯云 TBDS 搭建医疗数据中台,完成采集、存储、计算与可视化全流程;参与客户/产品/服务多主题模型设计,开发事实标签与预测标签,建立数据质量监控体系。
技术栈:腾讯云 TBDS, Hive, Spark, DataX, MySQL, Python
深圳市点嘀互联网络有限公司
2014.09 – 2016.12
数据开发
车载音乐推荐系统数据链路搭建,Spark Streaming 处理用户行为;负责日活、点击率、内容偏好等实时指标计算,通过分区与缓存优化流水线性能。
技术栈:Spark Streaming, Kafka, HBase, Redis, Python, SQL
项目经历

HunterClaw · 三层 Agent 数据架构

独立完成 · 2026.03 – 至今 · GitHub
  • GBrain 记忆层:SQLite 管理交易记录、策略日志、复盘结论;akshare 实时获取 A 股行情并缓存。
  • 市场温度模型管道:成交量聚合 → 情绪等级(冰点/暖意/强势等 6 级)→ 回测数据集 → 策略效果评估。
  • 风控指标体系:持仓市值/盈亏率/仓位占比/日收益率/最大回撤等多维监控与告警。

Alpha_Terminal · 行情聚合与 IMA 知识库

独立完成 · 2026.03 – 至今 · aialter.site · GitHub
  • 三路行情 ETL:腾讯财经主接口 + 东方财富备用 + 新浪财经快讯;TextDecoder 解决 GBK 乱码。
  • IMA 知识库接入:DeepSeek/腾讯 OAI 双模型 API 管理,Markdown 渲染分页展示。

东亚银行金融 AI 风控项目

开发 · 2024.04 – 2025.08
  • GPT + BERT 财务文本解析引擎,自动提取审计意见、附注风险信息。
  • 非结构化→结构化 pipeline,对接 Moodys 实现特征自动化迁移;科目编码转换解决数仓兼容问题。
  • 数据质量监控体系,确保 IFRS9 合规。

金蝶数据中台迁移

开发 · 2023.03 – 2024.03
  • 迁移规模:5000+ 表、10TB 数据、1500+ 任务,从原集群迁至数栖平台。
  • DataX/Flink CDC 同步 + AHP 脚本二次校验;租户 CSV 模板保障多租户隔离。
  • 成果:查询速度提升 35%,任务失败率 5%→1%,支撑 100+ 企业租户;参与客户 MySQL 数仓迁移至阿里 DataWorks。

金蝶云 SaaS AI 数据中台建设

数据开发 · 2020.03 – 2022.03
  • ODS→DWD→DWS→ADS 全链路,对接多业务系统全量初始化与增量实时同步。
  • 经营/产品/行为主题域模型;「光耀」金融主题对接外部征信,训练信用评分模型,数据沙箱保障合规。

金蝶指数及运营监测 · 企业客户画像

开发 · 2020.03 – 2022.03 · 项目链接
  • 基于精斗云数据构建经营规模/增长/风险/盈利能力综合指数;Spark K-means 聚类分层 + AHP 权重校验,支撑工信部小微企业监测。
  • 企业客户画像标签体系,多源采集 CRM/交易系统/行为日志,支撑人群圈选与精准营销,对接金蝶金融社区等集团产品。

Finance-Risk-RAG & LLM-Data-Analyzer(开源学习项目)

大模型数据工程 · 2025.10 – 2025.11
  • finance-risk-rag:银行级风控场景,Tesseract OCR + Chroma RAG + 规则/AI 融合识别 12 类风险实体,MD5 增量缓存。
  • llm-data-analyzer:LangChain + 可视化,CSV/文本多格式输入,Prompt 优化自动生成清洗报告。
项目佐证(可点击放大)

以下为自研平台与代表作截图,证明具备数据中台运维、Agent 编排与生产级落地能力。详细架构说明见 作品集

运维后台

多产品运维与 Pipeline 监控

统一域名下多业务线存活检测、Agent 心跳、Pipeline 断点恢复与灰度校验。

HunterClaw

三层 Agent 协作 + 模拟仓

决策/执行/数据分层,Pipeline 评分、辩论校验、T+1 盘后复核机制。

Finance-Risk-RAG

Finance-Risk-RAG v2.0

金融信贷文档全链路解析 + 实体融合检索,上万份样本验证。

学位房助手

决策支持型 Agent 产品

规则建模 + 回测验证 + 多区政策交叉校验,生产级 H5 落地。

教育背景 & 资格证书
五邑大学 · 本科 · 机械工程及自动化 · 2009 – 2013
大学英语四级 · 国家表彰 · 财务供应链顾问证书 / 专业资格证 · 国家专利(CN114331097A)· C1E 驾照 · 粤语精通