张玉东

个人信息Personal Information

特任副研究员

硕士生导师

电子邮箱:

学历:博士研究生毕业

学位:工学博士学位

毕业院校:中国科学技术大学

研究方向

当前位置: 中文主页 >> 研究方向

数据挖掘与信息检索

数据挖掘与信息检索(Data Mining and Information Retrieval)研究如何从大规模、多源、异构数据中发现潜在结构、建模复杂关系并支持高效的信息获取与决策过程,是支撑智能系统理解环境、用户行为与复杂系统运行机制的基础研究方向。该领域涵盖时空数据建模、用户偏好学习以及大规模语义检索等核心问题,其目标不仅在于预测或匹配本身,更在于为复杂任务提供可被进一步推理、生成与决策所利用的结构化信息基础。随着表示学习与大模型技术的发展,数据挖掘与信息检索逐步从以静态特征与离线分析为主的范式,演进为表示驱动、上下文感知与过程感知的数据智能体系。模型需要在动态环境与多轮交互中持续获取、整合与更新信息,从而服务于长期目标优化与复杂任务执行,这一变化使该方向与生成式模型和智能体系统在方法论层面形成内在耦合。

1. 时空数据挖掘与学习(Spatio-Temporal Learning):时空数据挖掘关注同时具有空间关联与时间演化特征的数据建模问题,如城市运行、交通网络、移动通信与地理环境等复杂系统。研究重点在于刻画多尺度时空依赖、非平稳动态与跨区域交互模式,使模型能够在异质性强、噪声大且分布不断变化的条件下进行稳定建模与预测。在面向复杂系统分析与决策支持的场景中,时空学习正逐步从单一预测任务扩展为情景建模与状态演化刻画,为后续的规划、干预与自主探索提供数据驱动基础。

2. 推荐系统与用户行为建模(Recommendation Systems):推荐系统研究如何从用户–物品–上下文交互数据中学习个性化偏好与行为规律,以支持精准内容分发与决策优化。除传统的相关性建模外,当前研究更加关注长期用户价值、多目标权衡与策略层面的推荐决策,强调推荐行为对用户状态与系统生态的长期影响。在交互式与生成式应用场景中,推荐系统逐渐从一次性预测转向多轮交互与策略调整过程,模型需要在持续反馈中动态更新用户表征与推荐策略,使推荐过程本身成为一个可学习、可优化的决策过程。

3. 稠密检索与语义匹配(Dense Retrieval):稠密检索通过学习连续向量表示,实现对大规模文本、文档或多模态内容的高效语义匹配,是现代信息检索系统的核心技术。该方向关注如何在高维表示空间中保持语义一致性与判别性,并在大规模语料条件下实现高效索引、快速召回与精排协同。随着模型能力的提升,稠密检索逐渐演进为复杂推理与生成过程中的信息支撑组件,在多步决策与任务执行中发挥持续的信息供给作用。