当前位置：网站首页>2021 software university ranking crawler program

2021 software university ranking crawler program

2022-06-26 08:56:00 【ML_ python_ get√】

# -*- Coding: UTF-8 -*-
# data.py
# @ author  ML_get
# @ Date of creation  2021-04-26T16:00:54.397Z+08:00
# @ Last modified date  2021-04-26T22:12:42.172Z+08:00
#  Soft science ranking 
import requests
from bs4 import BeautifulSoup
import json
import csv


class FindRank:
    def __init__(self, num):
        self.num = num
        self.headers = {
    
            'User-Agent':
            'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1 Edg/90.0.4430.85'
        }
        pass

    def parse(self, url):
        #  Pass in url Return a dictionary 
        try:
            response = requests.get(url, headers=self.headers, timeout=20)
            response.raise_for_status()
            dict_text = json.loads(response.content.decode())
            return dict_text
        except:
            return ''

    def get_data(self, ulist):
        #  Extract ranking information 
        #  Print header 
        print("{:^10}\t{:^20}\t{:^10}".format(' ranking ', ' School name ', ' score '))
        for i in range(self.num):
            u = ulist[i]
            print("{
    :^10}\t{
    :^20}\t{
    :^10}\
            ".format(u['rankOverall'], u['univNameCn'], u['score']))

    def store_data(self, ulist):
        with open('rank.csv', 'w', newline='') as f:
            w = csv.DictWriter(f, ulist[0].keys())
            w.writeheader()
            w.writerows(ulist)
        print(' Write successfully ')

    def run(self):
        #  Implement the main logic 
        # 1、 Get web information 
        url = 'https://www.shanghairanking.cn/api/pub/v1/bcur?bcur_type=11&year=2021'
        dict1 = self.parse(url)
        # 2、 Extract web page information, store it in data structure and display it 
        ulist = dict1['data']['rankings']
        self.get_data(ulist)
        # 3. Or deposited locally 
        self.store_data(ulist)


if __name__ == '__main__':
    rank = FindRank(300)
    rank.run()

原网站

版权声明
本文为[ML_ python_ get√]所创，转载请带上原文链接，感谢
https://yzsam.com/2022/02/202202170553132061.html

当前位置：网站首页>2021 software university ranking crawler program

2021 software university ranking crawler program

边栏推荐

猜你喜欢

随机推荐