现任上海富数科技有限公司算法负责人,杭州市人工智能学会会员。 曾任挖财网络技术有限公司建模分析专家,杭州贝贝集团有限公司算法专家。曾获2021年度上海市重点产业领域人才专项奖励。 从事方向主要为隐私计算与自然语言处理,并有分布式机器学习、搜索推荐、复杂网络与图计算等深厚算法背景。申请专利47项, 已授权算法领域发明专利24项。发表学术论文9篇,其中SCI4篇(JCR 1区、2区)、EI3篇、北大核心2篇。2015年获得中国优秀硕士学位论文(top10%)。 参与设计并主导实现隐私计算行业首创的全匿踪系列算法,包括全匿踪联邦学习算法、全匿踪混淆求交营销算法、全匿踪集团并表统计技术。入选2022年信通院“星河”最高级别十大标杆案例及中国信通院隐私计算白皮书。23年全匿踪算法在金融场景应用项目获得首届数商大赛金融数据创新应用赛道的全国一等奖。2023年国泰君安联合富数科技完成的课题《基于全匿踪联邦学习的财富管理客群挖掘研究》荣获评证券期货业金融科技研究发展中心(深圳)优秀课题二等奖。全匿踪联邦学习体系于2024年获密码科学技术奖励提名(市唯二)。所主导实施的多方安全计算算子库平台,在2021年与腾讯、蚂蚁一同成为当年首批通过中国信通院多方安全计算性能评测的厂商, 与微众、蚂蚁成为第一批通过多方安全计算金融应用技术测评(BCTC)的业内厂商。2021年面向深度学习的安全生物特征识别服务,实现最快的多方安全生物识别算法,性能竞标第一,并于2022年在中国银联成功应用。以此实现的信创竞赛项目《基于海光平台硬件加速的隐私计算人脸识别应用技术》获得2023年第二届光合组织AI解决方案大赛奖项。2018年主责技术的项目《基于深度学习及知识图谱的智能政务咨询服务平台》入库杭州市重大科技创新项目。 于2012年获得杭州电子科技大学学士学位,师从张树人副教授(浙江省现代互联网研究院副院长兼普创金融研究中心主任)。2012年-2015年期间在阿里巴巴复杂科学研究中心攻读计算机硕士学位,师从电子科技大学尚明生教授(现中科院博士生导师),并由韩筱璞教授(现杭师大阿里巴巴商学院智能商务与技术系副系主任)、张子柯教授(现浙江大学博士生导师)、吕琳媛教授(现中科大博士生导师)联合指导,该实验室是由阿里巴巴集团和杭州师范大学联合发起的综合性科研平台,电子科技大学、瑞士弗里堡大学联合培养。2015年腾讯(深圳)SNG社交网络事业群访问学生,2014年北京师范大学系统科学学院访问学生。2012年SIMPLE团队(三位成员之一)获首届中国互联网数据平台数据挖掘竞赛全国第一名。同年以队长身份获第十届华为杯全国研究生数学建模比赛三等奖。2014年所提出的“基于真实数据的信息传播问题”通过专家一致认可入选第十届全国复杂网络Top10问题,由大会主席香港城市大学陈关荣教授颁奖。作为CCF-腾讯犀牛鸟基金项目《大规模在线社交网络中高影响力用户的挖掘》核心成员,团队在2014年获得犀牛鸟优秀奖。 |
My name is Zhi-Qiang You, the Algorithm Lead at Fudata, where I specialize in the intricate worlds of machine learning, deep learning, and privacy-preserving computation. My passion lies in developing sophisticated algorithms that not only push the boundaries of artificial intelligence but also ensure the utmost in data security and privacy.
With a solid foundation in computer science and a keen interest in data-driven technologies, I've spent years refining my craft, from crafting neural networks that can learn and adapt to new challenges, to implementing advanced privacy-preserving techniques that safeguard user data.
As the Algorithm Lead, I oversee the creation and deployment of cutting-edge algorithms that power our AI systems. My role is a blend of technical expertise and strategic vision, ensuring that our algorithms are not only state-of-the-art but also aligned with the latest ethical standards and privacy regulations.
I thrive on the challenge of turning theoretical concepts into practical, real-world solutions that can transform industries and improve lives. Whether it's mentoring a team of talented engineers, collaborating with cross-functional teams to integrate AI solutions, or staying ahead of the curve with the latest research, I'm dedicated to driving innovation and excellence in the field of AI.
Joining Fudata has been an exhilarating journey, and I'm excited to contribute to our mission of harnessing the power of AI for good, while upholding the highest standards of privacy and security.
起止时间 | 公司及说明 | 业务领域 | 部门职位 |
---|---|---|---|
2020.9-至今 | 富数科技(隐私计算头部企业)(上海多方安全计算中心(上科委授牌))(高新技术企业)(专精特新企业)(科技小巨人企业)(泛亚信系) | 隐私计算 | 产研中心算法部算法负责人 |
2020.3-2020.9 | 贝贝(电商独角兽) | 移动电商 | 研发中心大数据团队算法专家(P7) |
2015.6 - 2020.3 | 挖财(互金独角兽) | 互联网金融 | 数据智能部&集团风控部建模专家(P7) |
2015.2-2015.5 | 腾讯(上市公司) | 社交网络 | 社交网络事业部数据中心知识发现组访问学生研究员(负责人:岳亚丁博士) |
2012.2-2012.8 | 信雅达(上市公司) | 金融软件 | 研发中心研发实习工程师 |
2010.1-2010.3 | 浙江同方会计师事务所(事务所) | 审计及资产评估 | 事务所实习数据分析师 |
富数科技-产研中心
算法专家TL
2020-至今, 算法部:领导8名算法同学
(1)设计并实施行业首创的全匿踪联邦学习算法方案,旨在解决行业合规痛点,并通过全流程保护隐私数据集合求交的交集和非交集,引领行业技术发展。
详述:全匿踪安全求交是数据安全的重要组成部分,解决多方数据求交集的任务,在风控黑名单、广告投放、用户属性查询等领域得到广泛应用。该方案的成功实施支撑中信证券成为2022年信通院最高级别“星河”标杆案例中首个全匿踪隐私计算案例的入选项目。我们不断优化方案,推出了基于MPC的高带宽算法版本以及基于Opprf的低带宽算法版本,以满足不同算法运行环境的需求,并提供最优解决方案。基于全匿踪隐私求交技术,我们进一步推出了全新的全匿踪混淆求交营销方案,解决了银行在使用安全求交技术时存在的安全合规问题。该方案在真实业务场景中展现出可观的营销效果,为行业提供了可靠的解决方案。
(2)带领团队研发落地基于tensorflow2.x版本的多方安全计算系统,该系统功能可以类比为具有数据安全保护能力的python标准库。
详述:算法遵循秘密共享机制,引入行业创新的明密文混合计算框架和异步化的弱网计算稳定性方案,实现两方、三方、多方的150+规模的MPC协议算子,可支持亿级数据的高效计算,在加法、乘法、比较、逻辑运算、中位数、最大最小值、百分位数等基础算子及统计算子性能上位于业内第一梯队。进一步地,将MPC应用于纵向联邦学习、全匿踪联邦学习、深度学习生物识别、混淆求交营销算法、风控决策引擎等场景,为公司在中信证券、中银金科、中移金科、国网电力等ToB领域的交付实施提供有力的技术支撑。研发的MPC系统,在2021年,与腾讯、蚂蚁一同成为当年首批通过信通院多方安全计算性能评测的厂商, 与微众、蚂蚁成为第一批通过多方安全计算金融应用技术测评(BCTC)的业内厂商。
(3)推动完善和提升纵向联邦学习平台,该平台可以理解为具备数据安全保护能力的sklearn机器学习算法库,支持类似阿里pai的低代码拖拽式的联邦学习平台。 功能覆盖主流算法,包括特征预处理、特征衍生、二分类、多分类和回归等。
详述:特征预处理算法包括缺失值、异常值、特征转换、采样、标准化和归一化等联邦分布式技术。特征衍生部分涵盖了OneHot编码、Label Encoding、Target Encoding、IV&WOE以及特征筛选等分布式安全计算方法。特征分析方面实现了Pearson相关系数、Spearman系数和VIF方差膨胀系数等联邦学习指标。学习算法方面涵盖了逻辑回归(BGD/Nesterov/Adam/Nadam)、决策树、LightGBM、XGBoost(二分类、多分类、回归)、随机森林、线性回归、softmax多分类(lbfgs)、KMeans和DNN等算法。针对分类任务评估指标包括模型稳定性PSI、特征影响显著性P-value、AUC、KS值、lift曲线、F1-score、Precision、Accuracy和Recall。多分类任务评估指标包括Micro-F1、Macro-F1和Weighted-F1。回归任务评估指标包括MSE、RMSE、MAE、R-squared和SSE。支持批量预测和API预测功能。算法可面向两方、三方(包括无数据发起方场景)和多方场景。建立相对完备的大规模数据分批预测、API预测等serving服务。进一步地,我们针对联合营销场景,推出基于集成树模型的人群包和匿踪评估营销算法能力。针对联邦算法的性能提升方面,针对高带宽和低带宽场景分别做了优化,采用了基于MPC和同态加密算法的纵向联邦算法,提出并落地全新的明密文混合的最小化MPC创新技术方案,引入量化压缩方案和低带宽友好的OU加密算法,联邦学习二分类、多分类、回归等算法性能在业内处于第一梯队。算法底层基于MPC(秘密共享)、半同态(Paillier、ZPaillier、OU)和全同态(CKKS)加密算法,以及密文打包和密文量化技术。针对联邦算法服务能力及稳定性方面,具备基于Ray的分布式计算能力,同时针对生产环境的弱网和机器性能,推动开发了断点续算、低配置适配等能力。对于提升模型效果,引入基于k-fold交叉验证的联邦模型权重初始值预训练方案加速模型学习指标提升。
(4)带领团队在隐私集合求交算法面向生产环境下低带宽亿级甚至百亿级安全求交需求满足。
详述:率先在业内引入基于vole&okvs版本的安全求交算法,通信量级降低到187n bit规模,是目前开源领域最快的版本。统计安全参数40的条件下,相对于已有的cm20版本求交算法,性能最大提升3倍,整体能力处于业内的前列。同时引入一种基于BufferingSocket的协程通信模式,算法底层只是发送/接收数据到缓冲区, 不用处理网络层的任何事情,封装的python接口只需要提供从缓冲区获取数据, 以及写数据到缓冲区的方法,所有的网络传输的事情都是由python框架层实现,通过额外的接口 getOutbound 获取一轮通信的全部信息,通过该模式,较好地与现有框架实现共存,快速实现算法的落地应用。进一步地,针对10w/100w/1000w与百亿数据的求交,提出基于Hbase方案,整体性能提升100% ~ 500%。 百万对百亿批量匿踪查询,提出去除OT的方案,算法性能提升600%+。
(5)参与相关研究课题申请及交付工作
详述: 参与上海密码局课题奖项申报、上海科委2024年区块链技术攻关专项项目课题申请及现场答辩工作、中国移动IT公司课题申请、广东科技厅多方安全计算开源项目交付、银联基于多方安全计算的生物识别课题申请及交付。
贝贝集团-数据平台推荐算法组
算法专家
2020-2020, 研发中心大数据团队: 虚线带1名算法同事
负责社群电商独角兽贝店业务:基于DAU用户增长的个性化Push2.0系统。
结果:优化后相对于1.0阶段,DAU均值提升约 290%,引导gmv提升140%,个推引导DAU占全站5.33%。
a. 负责面向用户生命周期个性化 push2.0 技术方案设计,涵盖推送文案、内容、时间、敏感度等个性化。
b. 推动完成项目离线个性化推送&基于IFTTT概念的实时推送系统开发及上线应用。
详述:产品化思维&全链路漏斗分析&线上服务指标监控。开发Multi-armed bandits(Exp3/ε-greedy/topk softmax/UCB 等)个性化文案优选算法(《基于Multi-Armed Bandits的个性化push文案自动优选算法实践》)、基于Bert的文本相似性度量智能文案元生成。上线基于用户行为 Retarget、u2i2i、Embedding元推荐、Wide&Deep Learning个性化选品模块。探索DNN个性化时 间模型及频控等个性化策略对uv提升影响。针对用户反馈数据及服务监控指标,及时提出改进方案。
挖财-数据智能部
算法专家
2015-2020, 数据智能部&集团风控部:带4名实习生
(1) 自然语言处理算法业务:针对社保事业部、记账事业部、社区事业部等部门提供算法支持
a.建立政务知识库及问答系统。结果:建立知识萃取链路,解决政务知识低质量。开发自有对话机器人,自助解决率 90%+,用户满意率超过人 工,缓解客服人力&提升用户满意度。问答系统在社保掌上通、闪电公积金、掌上社小保等多产品上线。实现社保知识库体系化,提升完备度及城市覆盖度。主导设计完整的爬虫知识萃取链路,提出基于社保地图 的知识完善思路,从源数据到问答对入库。 开发语义相似度匹配的重复问题过滤算法及Q2Q相似问法扩展。完成 IR-based 多轮对话机器人架构设计开发(工程策略&知识图谱&匹配算法召回排序多条解决路径), 使用 QP-召回-排序框架思路,其中工程策略包含 ES,AIML 等功能。基于 fasttext 混合意图识别算法;基于 slot-filling&知识图谱意图完整性检测算法;推动设计构建 neo4j 知识图谱;开发“融合句法结构模 式识别的注意力定位机制短文本问题匹配算法”;上线短文本语义匹配的召回排序API。横向扩展,丰富应用场景以及纵向迭代预研。对话系统推广到公积金场景,处理冷启动适配工作。开发 CNN 表征学习聚类算法的热门问题识别功能,支持调整首页&针对性完善知识。迭代基于 Bert&向量召回解决方案。该项目《基于深度学习及知识图谱的智能政务咨询服务平台》入库2018年杭州市重大科技创新项目。
总结:从0到1为社保公积金事业部搭建政务问题咨询平台,缓解客服人力不足。设计开发基于知识图谱的多轮对话机器人、基于句法结构的意图识别算法及基于注意力机制的短文本问题匹配算法,开发出基于CNN+Kmeans聚类算法支持热点问题功能。系统上线后, 算法自助解决率90%+,用户满意率46%+,超过人工30%的满意度,在政务问题咨询环节,完全替代人工。目前已在掌上社小保、闪电公积金、便民通等产品上线使用。
b. 智能记账,实现用户语音快速记账,缩短记一笔耗时。挖财记账app和微记账app上线使用 主导设计解决方案,涉及类目体系化、分类&金额提取自动化、用户反馈利用。开发上线基于Gated TextCNN 的账目文本多分类算法,分类准确率可达95%+; 基于NER的金额提取算法; 基于boosted bagging filter 的用户主动标注数据利用算法,采用的多层标注数据萃取系统可以有效对抗噪音,提取到用户标注的有效数据,自动定期更新分类模型,在噪音率为10%,模型识别准确度为98%,在噪音率为80%,模型的准确率也可达86%,在钱管家app上线使用。
详述: 为记账事业部设计开发全新的基于TextCNN的账目类别分类算法及基于CRF及rule-based混合命名实体识别算法,与研发一起落地上线。实现用户语音输入记账文本,自动提取出时间、金额、机构,并自动分类,明显提升了用户记账的效率,从初始繁冗的记账链路简化到只需要一步记账,用户的记账体验得到很大的提升。目前已在挖财记账app和微记账app上线使用。
c. 记账端流量变现,提升理财、贷款、办卡、保险4类变现渠道的转化效率,模型排序top30%用户对 目标用户召回率为 70%-87%,转化率相比运营选择人群包提升近5倍。整合 BI、数仓、研发,推进多数据源的特征开发,模型选型实验(FM,GBDT&LR,XGBOOST), 多轮A/B线 上测试,完成最优效果模型上线使用。迭代Wide&Deep,DeepFM 等CTR模型。
详述: 为记账事业部搭建用户商转意愿度预估模型系统。作为项目负责人,推动数仓、BI、算法、研发、运营协作,完成从数据获取清洗、特征构建、模型设计开发、测试上线一整套流程。从个人资料、手机设备信息、记账消费类数据、出行活动、资产负债、银行卡流水、理财行为构建187个特征,模型可以预测用户在理财、贷款、办卡、保险4类变现商转渠道上的点击/转化概率。为运营同学精准性营销,以及在有限的banner等广告位展现提供数据支持。该项目主要使用xgboost模型。
d. 为加强金融社区的资讯内容高效分发,提升用户活跃度以及用户留存,从0到1,带领团队开发面向社区的资讯推荐系统。通过资讯个性化推送,唤醒用户,相比运营精选帖子推送,在线打开率提升约25%。
详述:设计推荐算法整体框架(包括数据维度、存储结构、模型组件、应用层(召回排序)、策略)。引入基于用户类目偏好、协同过滤、操作行为、相似扩展等召回手段(涉及 ALS矩阵分解协同过滤算法、FP-Growth关联推荐算法、基于用户记账行为相似度的lookalike算法、基于doc2vec以及word2vec的帖子相似度推荐 、基于tag的推荐等技术),结合 文章质量分、时间衰减及业务规则过滤,通过GBDT/BPR等模型排序得到最终推送资讯。
(2) 金融风控算法业务:针对信贷风控、清结算、理财等部门提供算法支持
a. 贷前拒绝推断(内部代号:朱日和红蓝军项目)&风险识别&贷后催收。结果:扩大信贷业务放贷量,提出并落地半监督算法, 捞回率可观,超过预定捞回率目标约83%。主导半监督算法的实施,设计开发融合 label spreading、variational auto-encoder、outlier detection的半监督算法。结合业务实际思考,提出新的模型评估指标及训练目标,有效降低入催率。提升放贷资产质量,优化用户信用风险排序模型,放款用户坏账率得到改善,多期逾期率增速降低。设计开发“面向topK优化的adaptive风险评估模型”,排序靠前用户的坏账率降低。分析还款行为类型的多期转移概率,发现贷后用户在主动还款意识上的差异。实施“融合还款意愿识别的 stacking 模型”,放款用户主动还款比例明显提升。贷后催收, 基于贷后用户还款意愿度分层,制定不同催收策略,提升回款率,提出并完成还款序列模式与逾期行为的关系,挖掘有效行为模式。探索开发“结合还款序列信息的逾 期风险识别模型”, 对贷后用户进行分层。
详述: 区别于以风控策略为主的红军,作为蓝军,团队在40天内完成搭建上线独立的全流程以模型为主的信贷审批系统,从当前审批模型拒绝的用户中捞回更多好用户,捞回率30-50%, 首逾dpd10+低于break even的坏账红线,并优于红军。前期数据特征来自基础信息、身份证相关信息、通讯录/运营商、中互金、设备指纹、关系网络、催收相关、电商数据等三方数据等。后续去除通讯录等敏感信息。特征筛选主要基于iv,psi,缺失度,模型特征重要性。算法采用半监督学习算法框架(监督算法融入无监督学习的信息,如vae+gbdt&lr, label spreading+xgboost, outlier detection+lightgbm),以及adaptive xgboost。同时基于场景分析,先后采用dpd10+,dpd3+,基于还款意愿度的用户多分类分层等不同的训练目标。另外,尝试了DNN、Mixed Lr等。模型ks最高可达0.4+,同时首贷dpd10+优于红军。基于红蓝军对抗的结果及多变的环境,生产场景上线蓝军的模型为主&简单反欺诈策略过滤兜底的方法论,取代了红军复杂且不易迭代扩展的策略为主的方法论。
b. 社交亲密度识别:以应对风险为目的,主导开发基于通话行为的亲密号码识别算法。从不同视角,深入 挖掘通话行为模式,提取有效特征,落地多层次分类器,有效识别亲密号码。业务部门多场景上线应用。关于算法实践的更详细介绍,可以参考《互联网风控业务中的拒绝推断场景算法应用分享(涉及半监督算法、异常检测、变分自编码、样本权重自适应调整、迁移学习等)》、《互联网风控业务中的续贷审批模型(融合还款意愿分层的逾期风险识别模型)》。
详述: 为风控部门及子公司开发基于通话记录的亲密号码识别算法,从不同时间粒度的通话回复模式、主被动行为、周末/工作日模式、工作时间/私人时间、通话爆发性、周期性及沉默时长等方面设计了40个特征,并设计了层次分类器,第一层分类器首先区分是否为重要号码,第二层分类器则对重要号码再次进行细分,区分是否为直系亲属号码,最后结合重要性与直系亲属的概率,进行融合得到最终的预测分值。亲密朋友与直系亲属在行为上比较相近,测试结果表明模型可以判断出亲人密友的号码,而远房亲戚与一般陌生人的通话行为类似。目前该算法在风控部门及子公司上线使用。
c. 设备指纹:推动建立集团自有的设备指纹体系,以应对渠道刷单、多头借贷、精准营销、支付安全等多 需求。从无到有进行摸索,制定信息采集方案,推动完成 Android、iOS必要设备信息落库。并设计开发 设备指纹匹配系统,包含精准匹配、模糊匹配、级联贝叶斯匹配算法,具备较高的设备识别唯一性和稳定 性。相关成果在风控反欺诈、信用评估、竞品分析、关系网络等场景得到应用。
详述:推动构建集团自有的设备指纹体系,以应对渠道刷单、多头借贷、精准营销、支付安全等多需求。从无到有进行摸索,提出针对安卓、iOS设备所需要采集的信息字段,包括设备型号、applist、bssid等65个字段,并基于采集到的设备信息,设计开发设备指纹匹配系统,包含精准匹配、模糊匹配、级联分类匹配算法,在设备指纹识别场景可以达到较高的唯一性(99.92%)和稳定性(97.96%),作为imei、idfa、idfv之外新的用户设备id数据。目前设备指纹数据在产品推荐、风控反欺诈、信用评估、市场投放、竞品分析、用户追踪识别、关系网络等都得到了应用。
d. 资金流出预测:应清结算部门评估头寸需要,有效预测每日资金流出(用户提现),设计开发基于主因及波 动因子的层次残差拟合算法来预测每日用户提现额。真实数据显示该算法预测值相比于之前用的移动平均 模型,误差平均缩小58.4%,在超过亿元的真实提现额规模预测上,误差稳定在3%以内。
详述:早期为清结算部门开发模型预测每日资金流出(用户提现)。设计开发基于主因及波动因子的多维层次拟合算法来预测每日用户提现额。主因子为用户的到期金额以及账上余额,波动因子为到期人数、是否有营销活动、是否为节假日、股市行情等。先基于到期金额与账户余额线性回归初步预测值,计算真实值与初步预测值之间的差值,再利用波动因子作为对残差进行拟合,最后将初步预测值与残差预测值进行叠加,作为最终的预测结果。真实数据结果显示我们提出的算法预测值相比于清结算之前用的移动平均模型,误差平均缩小58.4%, 在超过亿元的真实提现额的预测上,模型的预测误差稳定在3%以内。
e. 基于 LBS 的高净值用户挖掘:为理财运营团队挖掘集团内高净值客群。基于记账GPS经纬度轨迹数据, 结合 POI 信息,设计开发用户家庭&工作地址识别算法,并采集家庭所在小区房价、地段、工作地办公性 质等价值评估信息,来推测用户是否是潜在高收入人群,为理财团队持续提供价值人群进行营销。
详述:为理财运营团队挖掘记账端高净值用户。基于记账数据的挖掘,对用户资产及用户投资风险偏好进行画像。该项目主要利用两类GPS经纬度数据及记账文本数据。首先通过用户记账产生的经纬度数据,设计用户家庭、工作地址的识别算法,并采集家庭所在小区的房价、地段等价值评估信息以及工作地的办公性质,来推测用户是否是潜在高收入人群。验证阶段,收集公司内部同事的信息以及采集部分绑定白金信用卡的记账用户信息来验证模型有效性。该模型从“不同时间背景下地址对用户的重要性指数”、“用户自身的轨迹稳定性”、 “地址对转移概率及距离交叉验证”等多角度进行刻画。用户投资风险偏好使用1-10分进行刻画。首先从记账数据挖掘与投资负债相关的渠道,如p2p、重金属、股票基金、期货、理财、房贷等近70种,分别标记风险值。利用投资记账笔数、金额成本、投资行为置信度、偏好权重系数与金额、笔数之间的关系修正,设计风险指数。对于多类目投资用户,使用加权平均指数刻画,而对于单投资类目用户,采用相对于均值的有偏差值来刻画。该投资风险指数的验证,通过在记账app的问卷调查获得用户的真实投资偏好与基于这批用户的记账数据计算得到的风险指数,总体层面呈现出一致的正偏态分布,个体层面分值偏差<=2的比例占比90% 。挖掘出的高投资风险偏好的高净值人群提供给理财高净值用户进行电销。
腾讯-社交网络事业部
访问学生研究员
2015.2-2015.5, 数据中心知识发现组
(1)腾讯应用宝:基于社交网络的推荐算法研究
详述:提出一种基于三部图网络结构(物质扩散/热传导)的面向社交关注关系的APP推荐算法,即给定目标用户,通过算法确定展示合适的亲密好友下载的潜在兴趣的APP的提示信息,能够明显提升点击率。该算法在腾讯内部数据已验证有效性,提供给内部开发团队实现。另外,2017-2018年,微信朋友圈上线了类似的功能,在展现的广告下方展示你的好友点赞状态,能够提升关注和转化,也间接验证了社交信息对于点击率提升的增强效果。
阿里巴巴复杂科学研究中心
研究助理
2012.9-2015.6, 复杂网络与机器学习
详述:【文本增强链路预测】为提升潜在兴趣用户推荐的关注率,提出创新性的思想:Neighbors tell more。利用微博及推特网络结构和文本数据,设计一种结合文本内容数据和社交网络信息的链路预测方法,提高用户关注关系预测的准确性。用户兴趣相似性和网络结构对关注边的形成有重要影响。新算法通过预训练模型文本向量化技术最大化兴趣相似性,结合网络桥接节点作用,显著优于传统链路预测算法,实验结果在AUC、precision、recall等指标上均表现出色,验证了算法的有效性。
起止时间 | 学位 | 院系/实验室/专业/研究方向 | 补充说明 |
---|---|---|---|
2012.9 - 2015.6 | 硕士(学术型) | 阿里巴巴复杂科学研究中心计算机应用技术复杂网络、机器学习 | 中国优秀硕士学位论文GPA 3.76(港科大4.3分制) 校一等奖学金杰出科研工作奖电子科技大学联合培养 |
2014.2 - 2014.3 | 访问学生 | 北京师范大学复杂网络、网络重构 | 压缩感知在信息压缩、网络重构应用 |
2008.9 - 2012.6 | 学士 | 杭州电子科技大学[计算机登峰学科(省唯一)]电子商务 | 专业top2GPA 3.63(港科大4.3分制)校级优秀毕业生校一等奖学金 |
2005.9 - 2008.6 | 高中 | 浙江金华第一中学-理科 | 超重本线及部分985录取分数线会考成绩全A |
【导师团】硕士阶段,由联合导师团负责培养,导师团成员: 尚明生教授(电子科大,现中科院博士生导师)、韩筱璞教授(现杭师大阿里巴巴商学院智能商务与技术系副系主任)、张子柯教授(现浙大博士生导师)、吕琳媛教授(现中科大博士生导师)。
【学位论文】硕士论文入选中国优秀硕士学位论文。 2012年本科毕业论文提出闲散物品二手交易模式并开发二手交易平台"有租网", 该模式早于2014年成立的闲鱼以及2015年成立的转转平台。
【学术会议】第十届全国复杂网络大会:“复杂网络在各学科领域的应用”分会场报告者 & 所提出的“基于真实数据的信息传播问题”通过专家一致认可入选全国复杂网络Top10问题,由大会主席香港城市大学陈关荣教授颁奖。
【学术会议】IEEE 2015年第34届中国控制会议(Chinese Control Conference (international))报告论文。
【课题】主持浙江省大学生科技创新项目《基于社交网络的价值流失预警模型的研究》。另以核心成员身份参与2010年大学生科技创新项目《绿团网——基于团购与点评模式的生态农庄旅游平台》,2010年首次提出农产品、农庄旅游的团购拼团模式,早于2015年成立的拼多多。
【课题】CCF-腾讯犀牛鸟基金项目《大规模在线社交网络中高影响力用户的挖掘》核心成员,团队并获得犀牛鸟优秀奖
【实验室联合项目】2013.12-2014.1, 电子科技大学&一淘网&杭州酷云网络联合“旺淘”直通车项目, 参与软件需求分析, 关键词词库构建及出价调价算法的设计。 被派驻公司将直通车专员人工经验设计成数学模型及软件接口形式。该产品已在淘宝上线, 排名前十。
【竞赛】首届中国互联网数据平台数据挖掘竞赛全国第一名(1/190), 参赛队伍包括南京大学、中国科学院软件所、中山大学等高校。参赛项目为基于随机游走和机器学习技术的个性化网站推荐算法,负责用户对网站的浏览点击行为的数据分析, 探索用户的行为, 参与推荐算法的设计, 与队友提出一种结合矩阵分解及物质扩散的混合推荐算法。
【竞赛】担任学院创新实验班核心成员,曾获计算机学院首页编程设计大赛等多类奖项。
【创新团队】学院互联网创新平台核心技术成员,负责学院创新项目研发。
【出版图书】2012-2013 年参编《杭州市互联网经济发展报告》,杭州市经济和信息化委员会主导,目前已由浙江大学出版社出版。
【软件著作权】开发安卓端移动app"活动召集令"
【英语】四六级英语分别为579、572, 上海中级口译证书(29期)、托业855分、托福(阅读level:high, 写作level:good)。
【学术夏令营】天津大学承办&中国科学院资助的龙星计划2013深度学习课程(主讲人邓力: 微软人工智能首席科学家)
【本科数学成绩】概率论与数理统计、离散数学、数学建模等数学课程成绩A等。
【职业资格证书】全国计算机技术与软件专业技术资格中级网络工程师
【实训证书】隐语开源社区“隐私计算实训营”第二期课程优秀学员
【授权发明专利】全匿踪混淆求交数据的共享方法、系统、设备及介质
尤志强, 赵东, 陈立峰
国家发明专利, CN118590236B, 公告日2024.11.01
【授权发明专利】一种随机分组的方法及装置、计算机程序产品、电子设备
尤志强, 卞阳, 涂志鹏, 张伟奇
国家发明专利, CN116319084B, 公告日2023.09.29
【授权发明专利】使用联邦学习模型进行人群包统计的方法及装置
尤志强, 王兆凯
国家发明专利, CN116521952B, 公告日2023.09.05
【授权发明专利】多方安全计算方法、装置、系统、电子设备和存储介质
尤志强, 卞阳, 赵东
国家发明专利, CN116055049B, 公告日2023.07.04
【授权发明专利】多方安全的数据重排方法、装置、电子设备及存储介质
尤志强
国家发明专利, CN115982785B, 公告日2023.06.30
【授权发明专利】短文本问题语义匹配方法和系统
尤志强, 潘琪
国家发明专利, CN109597994B, 公告日2023.06.06
【授权发明专利】一种信息推荐方法及装置
尤志强, 卞阳, 王兆凯
国家发明专利, CN115795174B, 公告日2022.04.25
【授权发明专利】全密态数据处理方法、装置、设备、介质
尤志强, 卞阳, 赵东
国家发明专利, CN115587382B, 公告日2023.04.11
【授权发明专利】隐私计算进程的安全监控方法、装置、设备、介质
尤志强, 卞阳
国家发明专利, CN115664839B, 公告日2023.04.11
【授权发明专利】基于异构联邦学习的预测方法、模型生成方法及装置
尤志强, 卞阳
国家发明专利, CN114611712B, 公告日2022.08.26
【授权发明专利】一种数据中位数确定方法及装置
尤志强, 卞阳, 赵东, 朱崇炳
国家发明专利, CN114595479B, 公告日2022.08.26
【授权发明专利】多方安全计算方法、电子设备及可读存储介质
尤志强, 赵东, 陈立峰, 卞阳
国家发明专利, CN114615282B, 公告日2022.08.23
【授权发明专利】一种纵向联邦学习模型的训练方法及系统
尤志强, 卞阳
国家发明专利, CN114330759B, 公告日2022.08.02
【授权发明专利】信贷申请的逾期风险预测方法及装置
尤志强, 车曦, 潘琪
国家发明专利, CN108389125B, 公告日2022.06.07
【授权发明专利】用户关系的识别方法、对象关系的识别方法及装置
尤志强, 潘琪, 车曦
国家发明专利, CN107392781B, 公告日2021.11.02
【授权发明专利】短文本分类方法及装置
尤志强, 车曦, 潘琪
国家发明专利, CN107301225B, 公告日2021.01.26
【授权发明专利】联邦学习代码生成方法、装置、电子设备及存储介质
卞阳, 尤志强, 赵东, 朱崇炳
国家发明专利, CN114282257B, 公告日2022.07.15
【授权发明专利】一种智能语义处理方法
康洪雨, 尤志强, 车曦, 潘琪
国家发明专利, CN109062895B, 公告日2022.06.24
【授权发明专利】基于移动端日志行为数据的用户流失预测方法及装置
车曦, 尤志强, 潘琪
国家发明专利, CN109034861B, 公告日2022.06.07
【授权发明专利】用于评估联邦学习模型的方法及装置
王兆凯, 卞阳, 尤志强
国家发明专利, CN116541870B, 公告日2023.09.05
【授权发明专利】一种数据匿名化方法、装置、电子设备及存储介质
赵东, 卞阳, 尤志强
国家发明专利, CN115982779B, 公告日2023.05.23
【授权发明专利】一种融合网络结构和文本信息的社交关系预测方法
张子柯, 许帅帅, 尤志强, 周鸽, 刘闯
国家发明专利, CN107729569B, 公告日2020.01.17
【授权发明专利】一种安全多方计算方法、装置、电子设备及存储介质
孙小超, 陈立峰, 卞阳, 尤志强
国家发明专利, CN114595483B, 公告日2022.08.02
【授权发明专利】特征分箱方法、装置、电子设备和计算机可读存储介质
陈立峰,李腾飞,卞阳,杨云波,尤志强
国家发明专利, CN116244650B, 公告日2023.10.03
【已受理】第一方联合第二方挖掘目标对象的方法及装置
尤志强, 陈立峰, 赵东
国家发明专利, CN118014641A, 申请日2024.01.23
【已受理】第一方对第二方进行非法数据识别的方法及装置
尤志强, 赵东, 陈立峰
国家发明专利, CN117688589A, 申请日2023.12.25
【已受理】在相互连接的多个子网中发现目标资源的方法及装置
尤志强, 赵东
国家发明专利, CN117829993A, 申请日2023.12.15
【已受理】用于在多个节点中进行资源推荐的方法
尤志强, 赵东
国家发明专利, CN117609621A, 申请日2023.11.30
【已受理】从多个数据集节点中筛选数据集的方法
尤志强, 王兆凯, 赵东
国家发明专利, CN117493630A, 申请日2023.11.27
【已受理】数据访问方法、装置、计算机设备和介质
尤志强, 王兆凯, 赵华宇
国家发明专利, CN117573827A, 申请日2023.11.21
【已受理】对目标节点进行数据质量评估的方法及装置
尤志强, 陈立峰, 赵东
国家发明专利, CN117574105A, 申请日2023.11.14
【已受理】用于数联网的算力撮合方法
尤志强, 卞阳, 王兆凯
国家发明专利, CN117579629A, 申请日2023.10.31
【已受理】利用数联网中的分布式算力执行计算业务的方法
尤志强, 卞阳, 赵东
国家发明专利, CN117579310A, 申请日2023.10.31
【已受理】用于XGBoost联邦学习模型训练的数据处理方法和装置
尤志强, 卞阳, 王兆凯
国家发明专利, CN117648992A, 申请日2023.10.31
【已受理】多方安全计算、学习模型的训练方法、系统、设备及介质
尤志强, 王兆凯, 赵东
国家发明专利, CN116305195A, 申请日2023.02.15
【已受理】纵向联邦学习模型的训练方法、装置、电子设备、介质
尤志强, 赵东, 朱崇炳
国家发明专利, CN117332872A, 申请日2022.09.08
【已受理】安全求交、联邦学习模型的训练方法及系统、设备及介质
尤志强, 陈立峰
国家发明专利, CN115392480A, 申请日2022.08.05
【已受理】基于MPC的联邦学习模型训练和预测方法、系统、设备及介质
尤志强, 赵东, 卞阳
国家发明专利, CN115525921A, 申请日2022.01.18
【已受理】数据要素可信流通网络系统及方法
杨天雅, 尤志强, 赵华宇, 卫骞, 杜浩, 赵东, 王兆凯, 卞阳, 张伟奇
国家发明专利, CN117811772A, 申请日2023.12.01
【已受理】数据混合处理方法、系统、设备、介质及数据处理系统
朱崇炳, 赵东, 尤志强
国家发明专利, CN115604010A, 申请日2022.10.18
【已受理】全匿联邦学习模型的训练方法、设备和存储介质
陈立峰, 卞阳, 尤志强, 王兆凯
国家发明专利, CN115438370A, 申请日2022.08.05
【已受理】一种生物特征提取方法及装置
王琪, 杨燕明, 高鹏飞, 周雍恺, 张高磊, 孙小超, 赵东, 尤志强, 张饶波
国家发明专利, CN115439903A, 申请日2022.08.16
【已受理】BIOLOGICAL FEATURE EXTRACTION METHOD AND APPARATUS
Wang,Qi; ...; YOU, Zhiqiang; Zhang, Raobo
世界知识产权组织专利, WO2024036809A1, 国际申请日2022.11.30
【已受理】针对多方联合生成的衍生数据的访问控制方法及装置
孙小超, 陈立峰, 李腾飞, 赵华宇, 卫骞, 杜浩, 尤志强, 张伟奇
国家发明专利, CN117411642A, 申请日2023.11.22
【已受理】基于图计算的数据搜索方法、装置、设备和存储介质
杜浩, 张洪锋, 佘亚丽, 孙小超, 陈立峰, 赵华宇, 卫骞, 尤志强, 张伟奇
国家发明专利, CN117520610A, 申请日2023.11.24
【已受理】相关随机性的生成方法及装置
孙小超, 陈立峰, 李腾飞, 赵华宇, 卫骞, 杜浩, 尤志强, 张伟奇
国家发明专利, CN117688588A, 申请日2023.12.20
【已受理】多维度数据资产分类方法、装置、计算机设备和介质
李腾飞, 陈立峰, 孙小超, 赵华宇, 卫骞, 杜浩, 尤志强, 张伟奇
国家发明专利, CN117688428A, 申请日2023.12.28
【已受理】基于大语言模型的交易对象推荐方法、装置、设备和介质
李腾飞, 陈立峰, 孙小超, 赵华宇, 卫骞, 杜浩, 尤志强, 张伟奇
国家发明专利, CN117688245A, 申请日2023.12.28
Empirical studies on the network of social groups: the case of Tencent QQ
Zhi-Qiang You, Xiao-Pu Han, Linyuan Lü, Chi Ho Yeung
PloS one 10 (7), e0130538.[PDF]JCR 一区
The role of research efficiency in the evolution of scientific productivity and impact: An agent-based model
Zhi-Qiang You, Xiao-Pu Han, Tarik Hadzibeganovic
Physics Letters A, Volume 380, Issues 7–8, 22 February 2016, Pages 828-836.[PDF]JCR 二区
Reconstruction of social group networks from friendship networks using a tag-based model
Yuan-Pan Guan, Zhi-Qiang You, Xiao-Pu Han
Physica A, Volume 463, 1 December 2016, Pages 485-492.[PDF]JCR 二区
Website-oriented recommendation based on heat spreading and tag-aware collaborative filtering
Zi-Ke Zhang, Lu Yu, Kuan Fang, Zhi-Qiang You, Chuang Liu, Hao Liu, Xiao-Yong Yan
Physica A, Volume 399, 1 April 2014, Pages 82-88.[PDF]JCR 二区
Modelling temporal patterns of news report
You Zhi-Qiang, Zhu Yan-Yan, Han Xiao-Pu, Lü Linyuan
Chinese Control Conference (CCC), 2015 34th Chinese, 10.1109/ChiCC.2015.7259829, 1345 - 1350.[PDF]EI
基于任务队列的新闻报道模型
尤志强, 朱燕燕, 韩筱璞, 吕琳媛
电子科技大学学报, 2016, 45(2): 295-300.[PDF]EI
基于社交网络的社群生长模型
尤志强, 管远盼, 韩筱璞, 邓小方, 吕琳媛
复杂系统与复杂性科学, 2015, 12(2): 72-77.[PDF]EI
一种安全高效的全匿踪纵向联邦学习方法
尤志强, 李月, 姜玮, 方竞, 陈立峰, 卞阳
信息安全研究, 2024, 10(6): 506-512.[PDF]北大核心
基于相关性的上海世界博览会行人流分析
尤志强, 韩筱璞
上海理工大学学报, 2013, 35(4), 313-320.[PDF]北大核心
在线社交网络的结构分析, 建模及预测
尤志强
2017年第七期中国优秀硕士学位论文全文数据库(信息科技辑)出版[PDF]