140 likes | 380 Views
实习报告总结. 报告人:孙远帅 2013 年 11 月 6 日. 1. 2. 3. 4. 部门简介. 百度工作. 实习总结. 找工作经验. 内容. 部门简介. 百度工作. 工作内容. 新模型调研 GBFM ( gradient boosting Factorization Model ) DANOVA. 新策略调研 去掉特征字段的默认值. 百度工作. 字段字典 负样本采样 把明文转换为签名. 数据流. Ins : pv#clk#feasign:fea_slot#feasign:fea_slot#…….
E N D
实习报告总结 报告人:孙远帅 2013年11月6日
1 2 3 4 部门简介 百度工作 实习总结 找工作经验 内容
百度工作 工作内容 • 新模型调研 • GBFM(gradient boosting Factorization Model) • DANOVA 新策略调研 去掉特征字段的默认值
百度工作 字段字典 负样本采样 把明文转换为签名 数据流 Ins:pv#clk#feasign:fea_slot#feasign:fea_slot#…… fea:{feacate}:fea_slot:feavalue#feasign#pv#clk 不同阶段模型训练
百度工作 自封闭式系统 机器学习系统 数据 预估函数 损失函数 优化方法
百度工作 优化方法 • 梯度下降法 • 牛顿法 • 为牛顿法L-BFGS • L1正则化优化方法OWLQN
百度工作 调研调参 目标:找到合适的参数值使损失函数值最小。 依据:训练集(测试集)损失函数值变化情况 遇到的问题 问题:GBFM线下调研效果比线上模型要好,但是上线不行 分析方法:交叉实验,画出预测与实际值的分布图
实习总结 知识查漏补缺 实习收获 理清职业规划 工作适应方法
找工作经验 准备基础知识 选择工作地点 面试总结完善 简历项目 剑指offer 程序员面试宝典 编程之美 C++性能 ………… 北京 上海 厦门 ……… 完善简历 完善知识 …………