导语
Python由于其良好的解释性、编译性以及互动性特征,在近年爆火的大数据分析与挖掘领域得到广泛应用。广西民族师范学院黄恒秋教学专家及其教学团队精心研究设计后,巧妙地将教产结合,基于配套教材《Python大数据分析与挖掘实战(微课版)》和相关课程设计、竞赛作品,打造了《Python大数据分析与挖掘实战》线上实践课程,近日正式上线头歌实践教学平台供广大师生学习和应用!
课程网址:
https://www.educoder.net/paths/3243
欢迎各界学习者前来学习!
一、理论与实践课程
课程简介
本课程基于2020年11月人民邮电出版社出版的《Python大数据分析与挖掘实战:微课版》教材及配套资源开发而成,内容包括Python编程基础、科学计算、数据处理、可视化、机器学习、深度学习,以及在金融、地理信息、地铁交通、文本、图像、GUI应用系统开发等主要领域应用案例,是学习Python大数据分析与挖掘应用的极佳选择。
课程重点介绍了如何学习Python数据分析技能和应用于具体领域的方法,课程内容主要由基础知识点讲授、实验闯关和综合实训三部分构成,具有较强的工程实践性。课程知识点覆盖面广泛,从引入Python语言基础、Numpy、Pandas、Matplotlib、Scikit-learn、关联规则、TensorFlow深度学习等基础知识,进阶到金融数据挖掘、地理信息数据挖掘、地铁交通数据挖掘、图像识别、文本挖掘等热门研究主题。教学团队在头歌平台投放教学视频63个,部署实验闯关题目76个,在完成Python编程基础知识教学的基础上,以多个应用案例为主,向学生展示了大数据分析与挖掘应用的Python实现全流程。本课程适用于大数据、数学、计算机、经济金融管理类的本科生和大专生学习,同时对于研究生及数据挖掘研究者、爱好者也具有很好的参考价值。

广西民族师范学院《Python大数据分析与挖掘实战》课程主页
课程目标
本课程依托头歌平台完善的实战训练和自动化评测,学员可在观看学习视频后挑战对应的实训关卡,实现理论知识和实践技能的协同发展。课程教学采用“原理讲解+编程实战”的模式,学生在完成理论知识学习和实战训练后,可以实现对核心技术与算法的熟悉和掌握。在考核方面,团队将实训任务模式贯穿于整个教学活动,使用平台提供的自动化评测机制,按照每个学生相应的关卡挑战分值和学习成果分析形成评估报告。团队期望学生在完成本课程的学习后能够基于Python语言提升编程技能,并形成较强的大数据分析与挖掘实战应用能力。
课程特色—GUI可视化应用开发
可视化应用开发通常有两种方式。一种是基于web的网站交互可视化,另一种是基于桌面应用软件的交互可视化。本课程采用纯Python的桌面应用软件开发,即图形用户界面(GUI)可视化应用开发。课程内容涵盖Pycharm安装、项目文件创建以及Pycharm配置Anaconda中QtDesigner的使用方法,借助函数图像、三维网络图、等高线图等对数据清洗、分析以及分类等方法原理进行动态描述,结合不同实际环境中的评价系统进行展示。在图形用户界面下,学生能够更加快速、直观地感受数据在程序操作下的变化情况,从而加深对不同数据分析方法和工具的理解。
GUI开发示例-水色图像水质评价系统教学视频
课程章节
教学视频
章节 |
视频名称 |
第1章 语法基础 |
1-1Python启动及界面认识 |
1-2Python安装扩展包 |
|
1-3python基本数据类型 |
|
1-4Python相关公有方法 |
|
1-5列表、元组与字符串方法 |
|
1-6条件语句 |
|
1-7循环语句 |
|
1-8函数 |
|
第2章 科学计算 |
2-1创建数组 |
2-2Numpy简介 |
|
2-3数组 |
|
2-4矩阵与线性代数运算 |
|
第3章 数据处理 |
3-1pandas简介、序列定义与操作 |
3-2数据框定义与操作 |
|
3-3外部文件读取 |
|
3-4常用函数 |
|
第4章 图像绘制 |
4-1Matplotlib绘图基本方法 |
4-2中文字符显示与坐标刻度 |
|
4-3Matplotlib常用图形绘制 |
|
第5章 机器学习与实现 |
5-1缺失值处理 |
5-2数据规范化 |
|
5-3主成分分析 |
|
5-4线性回归 |
|
5-5逻辑回归 |
|
5-6神经网络与支持向量机分类应用举例 |
|
5-7神经网络回归应用举例 |
|
5-8K-均值聚类 |
|
5-9关联规则 |
|
5-10一对一、多对一关联规则与应用举例 |
|
第6章 深度学习与实现 |
6-1TensorFlow2.0安装 |
6-2TensorFlow2.0基本使用举例 |
|
6-3多层神经网络分类问题应用举例 |
|
6-4卷积神经网络应用举例 |
|
6-5循环神经网络应用举例 |
|
第7章 基于财务与交易数据的量化投资分析 |
7-1案例背景、目标及实现思路 |
7-2基于总体规模与投资效率指标的综合评价 |
|
7-3技术分析指标选择与计算 |
|
7-4量化投资模型与策略实现 |
|
第8章 众包任务定价优化方案 |
8-1案例背景、目标及实现思路 |
8-2数据获取与探索 |
|
8-3指标计算 |
|
8-4任务定价模型构建 |
|
8-5方案评价 |
|
第9章 地铁站点日客流量预测 |
9-1案例背景、目标及实现思路 |
9-2二分法思想与数据处理 |
|
9-3指标计算(C1和C2) |
|
9-4指标计算(C) |
|
9-5数据可视化与因素分析 |
|
9-6神经网络预测模型的建立(一) |
|
9-7神经网络预测模型的建立(二) |
|
第10章 微博文本情感分析 |
10-1案例背景、目标及实现思路 |
10-2数据预处理过程 |
|
10-3支持向量机分类模型 |
|
10-4基于LSTM网络的分类模型 |
|
第11章 基于水色图像的水质评价 |
11-1案例背景、目标及实现思路 |
11-2数据获取与探索 |
|
11-3支持向量机分类识别模型 |
|
11-4卷积神经网络识别模型:彩图 |
|
第12章 GUI可视化应用开发 |
12-1Pycharm安装及项目文件创建 |
12-2Pycharm配置Anaconda中QtDesigner及使用方法 |
|
12-3水色图像水质评价系统 |
|
12-4上市公司综合评价系统 |
实验闯关项目
章节 |
实验闯关题目对应的知识点 |
第一章 实验闯关(题目10个) |
基本数据类型 |
基本数据结构 |
|
基本数据结构访问 |
|
列表append和extend方法 |
|
字符串连接 |
|
字符串拆分和子串查找 |
|
条件语句if |
|
循环语句while |
|
循环语句for和字典setdefault方法 |
|
函数定义及应用 |
|
第2章 实验闯关(题目5个) |
赋值定义较复杂数据结构 |
内嵌函数定义较复杂数据结构 |
|
数组运算 |
|
数组切片 |
|
数组连接 |
|
第3章 实验闯关(题目11个) |
序列和数据框 |
外部数据文件读取 |
|
逻辑索引、切片方法,groupby 分组计算函数应用 |
|
数据框关联操作 |
|
数据框合并操作 |
|
序列移动计算方法应用 |
|
数据框切片(iloc、loc)方法 |
|
数据框排序 |
|
数据框综合应用案例 |
|
序列及简单随机抽样 |
|
序列及较复杂抽样 |
|
第4章 实验闯关(题目7个) |
散点图绘制 |
线性图绘制 |
|
柱状图绘制 |
|
直方图绘制 |
|
饼图绘制 |
|
箱线图绘制 |
|
子图绘制 |
|
第5章 实验闯关(题目12个) |
缺失值填充 |
数据标准化 |
|
支持向量机分类模型及其应用 |
|
逻辑回归模型及其应用 |
|
神经网络分类模型及其应用 |
|
线性回归模型及其应用 |
|
神经网络回归模型及其应用 |
|
支持向量机回归模型及其应用 |
|
基于主成分分析的综合评价 |
|
K均值聚类算法及其应用 |
|
布尔数据集构建 |
|
基于布尔数据集的一对一和多对一关联规则挖掘 |
|
第6章 实验闯关(题目3个) |
多层神经网络模型基本使用方法 |
卷积神经基本使用方法 |
|
循环神经网络模型基本使用方法 |
|
第7章 实验闯关(题目10个) |
基于总体规模与投资效率指标的上市公司综合评价 |
投资组合构建及收益率计算 |
|
移动平均线指标的计算 |
|
指数平滑异同平均线指标的计算 |
|
随机指标K、D、J的计算 |
|
计算相对强弱RSI指标 |
|
乖离率指标BIAS的计算 |
|
能量潮指标OBV的计算 |
|
涨跌趋势指标的定义及计算 |
|
基于技术指标的股票价格涨跌趋势预测模型构建(支持向量机模型) |
|
第8章 实验闯关(题目6个) |
基于经纬度地理坐标数据的指标计算Z1-Z5 |
基于经纬度地理坐标数据的指标计算Z6-Z12 |
|
任务定价模型的构建 |
|
任务定价模型的应用 |
|
任务定价调整方案评价 |
|
任务定价调整方案应用 |
|
第9章 实验闯关(题目4个) |
大数据文件分块读取技术、二分法查找 |
地铁进站人数和出站人数统计计算 |
|
天气、周末、节假日数据指标设计及计算 |
|
因变量和自变量数据的融合计算 |
|
第10章 实验闯关(题目3个) |
文本数据预处理—-分词 |
文本数据预处理—-去停用词及数值 |
|
文本数据分类模型的构建—-支持向量机模型 |
|
第11章 实验闯关(题目5个) |
手写体图像数据集初识 |
基于全像素特征的手写体图像识别模型 |
|
基于全像素特征的人脸识别模型 |
|
基于像素主成分的人脸识别模型 |
|
基于纸币彩色图像的面额识别模型 |
二、学习导航
课程配套的PPT、程序和数据、教学大纲、教案、练习题参考答案、实训案例、考核材料等资源,可从教材官网获取:
https://www.ryjiaoyu.com/book/details/41401
课程章节列出的所有线上实验项目均可在本课程首页下选择“实践项目”获取,学员可按照教学安排顺序由简到繁进行学习,也可以依照个人学习能力选择相应模块实训关卡进行挑战学习。



挑战示例-大数据文件分块读取技术-二分法查找(向右滑动查看更多)
本课程所有章节配套视频讲解课程均可在头歌课程首页下获取,课程目录下选择“视频项目”即可观看学习各章节配套视频。


讲解视频和课件详情摘要(向右滑动查看更多)
三、教材简介

《Python大数据分析与挖掘实战(微课版)》教材图片
2020年11月人民邮电出版社出版的《Python大数据分析与挖掘实战:微课版》,此教材以应用为导向,将理论与实践有机融合。具体内容分为基础篇、案例篇和附录三个部分,覆盖了Python大数据分析与挖掘技能学习的主要内容,包括Python编程基础、科学计算、数据处理、可视化、机器学习、深度学习、GUI系统开发以及在金融、地理信息、地铁交通、文本、图像等主要应用领域,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本理论知识,以及如何运用到具体领域的实践方法,教材内容丰富,是一部难得的好教材。
教材出版后,截止2021年8月30日,在出版不到一年(9个月)时间里,教材重印1次,销售5300多册,据不完全统计40多所高校作为教学用书,110多所高校作为图书馆或者教参用书。教材为数据科学与大数据技术专业系列规划教材。
四、作者简介

《Python大数据分析与挖掘实战(微课版)》主编 黄恒秋
黄恒秋,CPDA项目数据分析师,2011.7-2014.6 就职于深圳市国泰安信息技术有限公司,从事CSMAR数据库分析师、软件策划及设计相关工作。2014.9-至今,广西民族师范学院数理与电子信息工程学院专任教师,从事数据分析与挖掘、数学建模、Python语言、MATLAB语言、高等数学相关课程教学工作。第一作者发表中文核心期刊论文3篇,其中EI源刊1篇。作为第一主编出版教材《Python金融数据分析与挖掘实战》和《Python大数据分析与挖掘实战(微课版)》2部。2019年组织参加第七届“泰迪杯”数据挖掘挑战赛,获全国一等奖1项,二等奖2项,三等奖4项。2019年组织参加第一届广西大学生人工智能设计大赛(大数据建模赛道)获一等奖1项,二等奖2项,三等奖6项。2020年组织参加第二届广西大学生人工智能设计大赛(AI建模创新赛道)获二等奖8项,三等奖8项。2019~2021年指导学生参加互联网+创新创业大赛和挑战杯竞赛获区铜奖和区二等奖共计3项。

如若转载,请注明出处:https://www.yiheng8.com/152234.html