咨询热线 13923776320

您所在位置: 北京曼顿企业管理咨询有限公司> 学校课程> 数据采集技术培训(北京,7月20-21日)

数据采集技术培训(北京,7月20-21日)

▪ 授课机构:北京曼顿企业管理咨询有限公司

▪ 地址:北京市海淀区

▪ 发布时间:2017-06-29

咨询热线

13923776320

网报价格:5500

课程原价:5500

课程详情| 学校简介| 学校地址| 网上报名

数据采集技术培训(北京,7月20-21日)
【举办单位】北京曼顿培训网  www.mdpxb.com   中国培训资讯网  www.e71edu.com
【咨询电话】4006820825   010-56133998  13810210257 
【培训日期】2017年7月20-21日
【培训地点】北京
【培训对象】
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到网络采集、处理和规划的负责人、设计人员。
3,政府机关,金融保险、移动等以互联网信息为数据来源单位的负责人。
4,高校、科研院所牵涉到网络数据采集与数据处理的项目负责人。

【课程背景】
Python是一种面向对象、解释型计算机程序设计语言,Python是纯粹的自由软件,源代码和解释器CPython遵循 GPL协议。是一个用于统计计算和统计制图的优秀工具,也是GNU的一个免费、源代码开放的软件。
Python语法简洁清晰,具有丰富和强大的库,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。 Python爬虫包括一套完整的数据采集、处理、计算系统,简便而强大的编程语言,可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
本培训将对基于Python爬虫进行数据采集、处理、数据分析的方法深度剖析,并对Python爬虫原理及实现进行讲解。

【课程背景】
Python是一种面向对象、解释型计算机程序设计语言,Python是纯粹的自由软件,源代码和解释器CPython遵循 GPL协议。是一个用于统计计算和统计制图的优秀工具,也是GNU的一个免费、源代码开放的软件。
Python语法简洁清晰,具有丰富和强大的库,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。 Python爬虫包括一套完整的数据采集、处理、计算系统,简便而强大的编程语言,可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
本培训将对基于Python爬虫进行数据采集、处理、数据分析的方法深度剖析,并对Python爬虫原理及实现进行讲解。

【学员基础】
1,对IT系统设计有一定的理论与实践经验。
2,具备信息检索IR和大数据处理的基础知识。
3,有一定的python基础知识和开发经验。

【培训目标】
1,全面了解Python爬虫的相关知识。
2,学习Python爬虫的核心技术方法以及应用特征。
3,深入使用Python在网络数据采集中的使用。

【课程大纲】
第一讲 网络爬虫基础
1.什么是网络爬虫
2.浏览网页的过程
3.URL的含义
4. 环境的配置
第二讲 Python爬虫基础知识
1.Python爬虫基础学习
2.Python urllib和urllib2 库的用法
3.Python 正则表达式
4.BeautifulSoup简介
5.爬虫框架Scrapy
第三讲 Urllib库的基本使用
1.网页爬取示例
2.网页爬取方法
3.构造Requset
4.POST和GET数据传送
第四讲 Urllib库的高级用法
1.设置Headers
2. Proxy(代理)的设置
3.Timeout 设置
4.HTTP的PUT和DELETE方法
5.使用DebugLog
第五讲 正则表达式
1.了解正则表达式
2.正则表达式的语法规则
3.正则表达式相关注解
4.Python Re模块
第六讲 Beautiful Soup的用法
1. Beautiful Soup的简介
2. Beautiful Soup 安装
3. 创建 Beautiful Soup 对象
4. Beautiful Soup对象种类
5. 遍历文档树
第七讲 开始采集
1.遍历单个域名
2.采集整个网站
3.通过互联网采集
4.用Scrapy采集
5.几个示例
第八讲 存储数据和读取文档
1.媒体文件
2.把数据存储到CSV
3.MySQL与Python整合
4.读取纯文本和CSV文档
5.读取Word和.docx
第九讲 自然语言处理基础
1.概括数据
2.马尔可夫模型
3.自然语言工具包
4.用NLTK做统计分析
5.用NLTK做词性分析
第十讲 用爬虫测试网站
1.测试简介
2.Python单元测试
3.Selenium单元测试
4.Python单元测试与Selenium单元测试的选择

【讲师介绍】
   杨老师,曼顿培训网(www.mdpxb.com)资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

【费用及报名】
1、费用:培训费5500元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。
2、报名咨询:4006820825  010-56133998  56028090  13810210257   鲍老师
3、报名流程:电话登记-->填写报名表-->发出培训确认函
4、备注:如课程已过期,请访问我们的网站,查询最新课程
5、详细资料请访问北京曼顿培训网:www.mdpxb.com (每月在全国开设四百多门公开课,欢迎报名学习)

 

免责声明:以上信息是由学考培训网平台用户自行发布,所有内容均由发布者对信息的真实性负责,学考培训网仅提供信息发布、展示,不对用户信息内容的真实性负责,请用户自行甄别,谨防受骗!!

北京曼顿企业管理咨询有限公司简介

北京曼顿企业管理咨询有限公司(以下简称北京曼顿咨询)成立于2005年,旗下网站为中国培训资讯网(www.e71edu.com),是国内较早一批专业的综合性的培训单位之一。是总部位于美国的国际职业认证标准联合会在北京地区授权的培训考试及认证单位[认证号:IOCL086132],同时也是香港培训认证中心授权的培训认证机构[认证号:HKTCC(GZ)A10-11221]。本单位主要从事企业管理、项目管理、市场营销和和人力资源管理方面的咨询培训服务。历经多年的发展,已经为近千家企业提供过各种形式的咨询培训服务,客户涵盖了电子电器、通讯、计算机IT行业、金融保险、建材、化工、食品、机械、服装/鞋业、礼品包装、塑胶五金/模具、电线电缆等十几个行业领域,在业界具有广泛的权威和影响力。本单位师资由资深顾问以及业界知名专家组成,顾问师2/3为硕士研究(MBA)以上学历。我们的专家团队基本都来自于财富500企业,具有丰富的实战经验和系统全面的理论知识。

公开课方面,北京曼顿咨询每年在上海、天津、北京、广州、深圳、杭州、苏州、宁波、南京、青岛、合肥、武汉、长沙等城市定期举办公开课程,每年有上千期公开课程成功举办,学员来自各行各业,遍布全国各区域。每年在国内的公开课数量在同类公司中也高居前列,为企业、职业经理人以及爱学习人士提供了有力的培训信息保障。

企业内训方面,自成立以来,一直致力于开发适合中国企业的运营管理实务内训课程,我们已开展了数百场的内训课程。通过多年的探索与实践,我们的内训课程更加体现个性化需求,内训解决方案更科学合理,具有极强实战性与可操作性。本公司已为世界500强企业中的120多家企业提供过内训实施及信息服务,典型客户包括工商分行、东风雪铁龙、可口可乐、本田、上汽、3M、三洋、中石油、中石化、西门子、波音、大众汽车、通用汽车等,满意度高达95%以上。

  • 学校名称:北京曼顿企业管理咨询有限公司

    固定电话:13923776320

    授课地址:北京市海淀区 预约参观

网上报名抢优惠