学生抑郁与生活方式数据集(10 万条数据)

张开发
2026/5/22 12:25:29 15 分钟阅读
学生抑郁与生活方式数据集(10 万条数据)
学生抑郁与生活方式数据集10 万条数据 数据集概述心理健康是学术领域日益关注的问题。本数据集模拟了一项针对 10 万名大学生的大规模调查重点关注他们的生活习惯、学业表现和心理健康状况。该数据集旨在为探索性数据分析EDA、分类和回归任务提供丰富的资源。它使研究人员和数据科学爱好者能够调查睡眠模式、学习习惯和社交媒体使用如何与学业成功CGPA和心理健康问题抑郁和压力相关联。 数据规模•样本数量: 100,000 条记录•特征数量: 11 个字段•数据完整性: 无缺失值•数据类型: 结构化表格数据•适用领域: 心理健康、教育研究、数据科学 数据字段说明本数据集包含以下字段基本信息字段字段名数据类型说明Student_ID整数学生唯一标识符Age整数学生年龄18-24 岁Gender分类变量性别Male/FemaleDepartment分类变量所属学院/专业领域学业表现字段字段名数据类型说明CGPA浮点数累积平均绩点范围通常为 0-4.0Study_Hours浮点数每日学习时间小时生活方式字段字段名数据类型说明Sleep_Duration浮点数每日睡眠时长小时Social_Media_Hours浮点数每日社交媒体使用时长小时心理健康字段字段名数据类型说明Physical_Activity整数每周身体活动时长分钟Stress_Level整数自我报告的压力水平0-10 分量表Depression布尔值心理健康状态True 可能抑郁False 健康专业类别Department数据集中可能包含的专业方向•Science- 科学类•Engineering- 工程类•Medical- 医学类•Arts- 艺术类•Business- 商科 潜在应用场景本数据集用途广泛可用于各种机器学习项目 二元分类预测学生是否可能患有抑郁症Depression列基于其生活方式和压力水平。 回归分析根据学习时间和睡眠习惯预测学生的 CGPA。 聚类分析根据学生的习惯将他们分为不同的群体例如高成就者、高风险学生。 数据可视化分析社交媒体使用与压力水平之间的相关性。 其他应用• 探索睡眠质量与学业表现的关系• 研究身体活动对心理健康的影响• 识别需要心理干预的高风险学生群体• 为高校心理健康服务提供数据驱动的决策依据⚙️ 数据生成方法这是一个通过编程生成的合成数据集旨在反映学术研究中发现的真实世界趋势和相关性。相关性逻辑数据生成过程包含加权逻辑其中低睡眠时长和高社交媒体使用等因素会增加高压力和低 CGPA 的概率。数据规模优势拥有 100,000 条记录本数据集适合测试性能密集型算法例如深度学习/神经网络。 使用建议数据加载示例Pythonimport pandas as pd # 读取数据集 df pd.read_csv(student_depression_lifestyle.csv) # 查看基本信息 print(df.info()) print(df.describe()) # 检查缺失值 print(df.isnull().sum())注意事项1.数据隐私: 使用本数据时请遵守相关隐私保护法规2.研究伦理: 涉及心理健康数据的研究报告需遵循学术伦理规范3.引用说明: 在研究成果中应适当引用本数据集来源4.数据局限性: 注意数据的采样方法和潜在偏差 相关研究领域的关键词• 大学生心理健康• 抑郁症筛查• 生活方式医学• 健康行为学• 心理社会因素• 压力管理• 心理健康干预

更多文章