当前位置:网站首页>推荐书籍 > 正文 >>

数据科学实用算法

图书信息

作者:(美)布赖恩·斯蒂尔(BrianSteele),(美)约翰·钱德勒(JohnChandler),(美)斯瓦纳·雷迪(SwarnaReddy)著胡训强,王净,曹建译

出版社:清华大学出版社

定价:98.00

ISBN:9787302531104

出版时间:2019-11-01

分类:图书,行业职业,计算机,工具书

商品介绍

目录

第I部分数据约简

第1章数据科学碰

1.1什么是数据科学?

1.2美国的糖尿病数据

1.3《联邦党人文集》的作者数据

1.4预测纳斯达克股价

1.5述评

1.6关于本书

1.7算法

1.8Python语言

1.9R语言

1.10术语和符号

1.11本书网站

第2章数据映射和数据字典

2.1数据约简

2.2政治捐款

2.3字典

2.4教程:大金主

2.5数据约简

2.5.1符号和术语

2.5.2政治捐款示例

……

内容简介

《数据科学实用算法》将重点讲述数据分析的基石-算法。要成为一名数据分析专家,你必须了解算法原理,否则会产生挫败感、进入死胡同、浪费时间以及失败。《数据科学实用算法》将基本原理、算法和数据融为一体,提供大量Python和R代码,执行真实的数据分析,帮助你熟练编写程序,处理富有挑战性的数据。在学习过程中,你将沉浸在Python中,深入了解数据科学的基本算法和方法,获得根据新问题改编算法和进行创新分析的能力。

《数据科学实用算法》面向数学、统计学和计算机科学专业的高年级本科生和研究生,可用作一学期或两学期的数据分析课本。先修科目要求不高,学过一两门概率论或统计学课程、接触过向量和矩阵、学过编程课程的学生不会遇到任何困难。每章结尾处通常进行扩展,介绍数据科学从业者感兴趣的创新内容,提供不同难度的练习。

《数据科学实用算法》也非常适合自学,可作为从业人员的参考书籍。

《数据科学实用算法》分为三部分。第I部分“数据约简”首先讨论数据约简和数据映射等概念,然后讲述关联统计、可扩展算法和分布式计算等基础知识。第II部分“从数据中提取信息”呈现线性回归、数据可视化和聚类分析等主题,用一章的篇幅介绍医疗分析的关键领域。第III部分“预测分析”通过开发两个基本且广泛使用的预测函数(k近邻和朴素贝叶斯)向读者介绍预测分析技术,用一章的篇幅专门论述预报,最后一章重点介绍数据流。

推荐书籍