Francis

张博涵的个人博客


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

数据挖掘--爬虫--Ajax数据爬取

发表于 2019-02-22 | 更新于: 2023-02-26 | 分类于 crawler
Ajax  Ajax,全程Asynchronous JavaScript and XML,即异步的JavaScript和XML,在保证页面不被刷新、页面链接不改变的情况下与服务器交换数据并更新部分网页的技术。 爬取今日头条街拍123456789101112131415161718 ...
阅读全文 »

数据挖掘--爬虫--解析库

发表于 2019-02-22 | 更新于: 2023-02-26 | 分类于 crawler
XPath  XPath,全程XML Path Language,是一门在XML文档中查找信息的语言,也适用于HTML文档的搜索  XPath用法    lxml库用法 概览常用规则 表达式 描述 nodename 选取此节 ...
阅读全文 »

数据挖掘--爬虫--基础库

发表于 2019-02-22 | 更新于: 2023-06-17 | 分类于 crawler
urllib  urllib包含4个模块: request 基本的http请求模块,用来模拟发送请求。 error 异常处理模块,用于捕获异常保证程序不会意外终止 parse 工具模块,提供了许多URL的处理方法 robotparser 主要用来识别网站中的robots.t ...
阅读全文 »

数据挖掘--爬虫--爬虫基础

发表于 2019-02-21 | 更新于: 2023-02-26 | 分类于 crawler
HTTP基本原理URI和URL  URI(Uniform Resource Identifier),统一资源标志符;URL(Uniform Resource Locator),统一资源定位符;URN(Uniform Resource Name),统一资源名称,只命名组员而不指定如 ...
阅读全文 »

数据挖掘--爬虫--准备工作

发表于 2019-02-21 | 更新于: 2023-02-26 | 分类于 crawler
python环境的准备工作  博主在这使用windows作为系统环境,安装anaconda3作为python运行与库管理环境。  anaconda官方网站  如果下载速度过慢,可以选择使用清华大学镜像,使用说明 请求库的安装requests ...
阅读全文 »

向量

发表于 2018-12-28 | 更新于: 2023-02-26 | 分类于 dsa
向量ADT(Aabstract data type)  抽象数据类型,数据模型+定义在该模型上的一组操作 DS(Data Structure)  数据结构, 基于某种特定语言,实现ADT的一整套算法   c/c++语言中,数组A[]中的 ...
阅读全文 »

ElasticSearch学习笔记(一)

发表于 2018-12-04 | 更新于: 2023-02-26 | 分类于 elk
ElasticSearch(ES)有关的基本概念 Cluster和Node  ES中的Cluster是对外提供搜索服务的集群,组成这个Cluster的各个节点叫做Node。  Node分类:IndexNode(提供读写),DataNode(只提供数据存储和访问 ...
阅读全文 »

ELK日志分析系统搭建过程以及使用说明

发表于 2018-12-04 | 更新于: 2023-02-26 | 分类于 elk
环境搭建环境搭建说明Centos 7 *2 + elastics 5.6.12 + logstash 5.6.12 + kibana 5.6.12 + filebeat 5.6.12 ElasticSearch环境搭建 下载解压 12wget https://artifacts.elastic.c ...
阅读全文 »

shiro框架基础知识

发表于 2018-11-24 | 更新于: 2023-02-26 | 分类于 java
简介  Shiro是java的一个安全框架。可以帮助我们完成:认证、授权、加密、会话管理、与web集成、缓存等功能。  Shiro不会去维护用户、维护权限,需要我们自己去提供设计,然后通过相应接口注入给shiro。 身份验证  在shiro ...
阅读全文 »

大数据环境搭建过程记录

发表于 2018-11-23 | 更新于: 2023-02-26 | 分类于 bigdata
步骤一、配置免密登录  配置服务器间ssh免密登录https://atbulbs.github.io/2018/02/03/Hexo%E5%8D%9A%E5%AE%A2%E7%9A%84%E4%BD%BF%E7%94%A8/ 前提条件 系统已经安装有ssh 操作用户最好拥有/et ...
阅读全文 »
<123…6>

58 日志
25 分类
61 标签
GitHub E-Mail Google FB Page StackOverflow
Links
  • atbulbs
  • nep大佬
  • 崔庆才大佬
  • crossoverjie大佬
© 2018 — 2023 zhangbohan.dell@gmail.com
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4
鲁ICP备18038198号-2   鲁公网安备 37072402371021号