项目成员:王姝茗、门玉欣、刘彦俪、刘祎凡
指导教师:杨晨
作品简介:本项目基于大数据与人工智能技术,面向医保基金精细化管理、骗保行为精准识别及疾病风险提前预判的需求,采用 “数据处理 - 模型分析 - 可视化交互” 的三层架构(数据层、分析层、应用层),集成医疗保险信息可视化、医保骗保预测及疾病预测功能。通过 Python 生态工具(Pandas、Scikit-learn 等)结合 KNN、XGBoost、Prophet 等模型,实现医保数据的多维度分析与预测,为医保监管、医疗资源调配及健康管理提供高效、智能的决策支持工具。
图1 医保信息的热力图、混淆军阵
图2 骗保预测准确率
项目创新点:
(1)技术创新:本项目构建医保数据智能分析系统,采用多技术协同架构。融合 KNN 模型的简单可解释性与 XGBoost 的高预测精度,分别适配快速初筛与精准分析场景;数据处理环节整合 ETL 工具与分布式存储技术(Hadoop HDFS),实现多源医保数据(结构化费用明细、非结构化病历文本)的清洗、融合与高效存储;交互层面借助 ECharts 搭建交互式可视化界面,支持热力图、折线图等动态展示,并通过参数可调的模型训练模块(如分析精度滑块)优化用户体验,多技术协同提升系统的数据分析深度与操作便捷性。
(2)应用创新:面对传统医保管理中数据孤岛、骗保手段隐蔽及疾病趋势难预判等问题,本项目构建的智能分析系统可实现全流程智能化处理。通过医保信息可视化直观呈现基金收支、就诊频次等关键指标;基于 KNN 模型的骗保预测精准识别异常就医行为;结合时间序列分析与分类模型的疾病预测提前预警发病趋势,适用于医保监管部门风险防控、医疗机构资源调配及参保人群健康干预场景,推动医保管理从被动应对向主动防控转型,为医疗保障体系的智慧化升级提供新路径。
项目视频: