yujian
2019-12-25 59aced4fe04f7e2fdcca81cb9ef279a70522301e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
package com.yeshi.fanli.util.goods.jd;
 
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
 
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
/**
 * 京东内优惠商品爬取 https://www.n-youhui.com
 * 
 * @author Administrator
 *
 */
public class NYouHuiUtil {
    public static List<String> getClasses() {
        List<String> classList = new ArrayList<>();
        try {
            Document doc = Jsoup.connect("https://www.n-youhui.com").timeout(20000)
                    .userAgent(
                            "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36")
                    .get();
            Element classesRoot = doc.getElementsByClass("widget_categories").get(0);
            Elements level0 = classesRoot.getElementsByClass("level-0");
            for (int i = 0; i < level0.size(); i++) {
                String name = level0.get(i).html().replace("&nbsp;", "").replaceAll("\\(([0-9]|,)*\\)", "").trim();
                classList.add(name);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return classList;
    }
 
}