博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java网络爬虫
阅读量:6983 次
发布时间:2019-06-27

本文共 532 字,大约阅读时间需要 1 分钟。

hot3.png

(单机)WebMagic :  ml

API文档地址:  

官网            :    

 

小例子:

package com.tanle;

import java.io.IOException;

 

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Test {

    public static void main(String[] args) throws IOException {

        // 获取该网址的所有a标签href
        Document doc = Jsoup.connect("http://www.123hao.cn").get();
        Elements elements = doc.select("a");
        for(Element element : elements){
        System.out.println(element.attr("href"));
        }
    }

}

转载于:https://my.oschina.net/u/2462659/blog/873707

你可能感兴趣的文章
Dart的HTTP请求和响应(1)
查看>>
寻找最大的K个数,Top K问题的堆实现
查看>>
自动发布工具应该具备的11个标准特征
查看>>
页面设计四大基本原则
查看>>
2016及以后的自动化测试趋势 -《测试技术六月刊》
查看>>
基于Angular创建后台数据模拟(译)
查看>>
Spring中bean配置的继承
查看>>
用JSP实现学生查询
查看>>
企业网站怎么建设
查看>>
数据库和MySQL相关面试题目
查看>>
Yii 框架学习--01 框架入门
查看>>
All Things OpenTSDB
查看>>
android 网络通信框架volly
查看>>
二分查找算法及其变种
查看>>
一个泛型冒泡排序的实现
查看>>
大型分布式网站架构设计与实践 第一章《面向服务的体系架构(SOA)》
查看>>
[From OpenBSD Man Page]PFSYNC
查看>>
hdu 5131 Song Jiang's rank list 【2014ACM/ICPC亚洲区广州站-重现赛】
查看>>
JS笔记(20): JS中的同步编程和异步编程
查看>>
那几个题(没懂的地方留言)
查看>>