zhenxun_bot/plugins/draw_card/update_game_simple_info.py

from typing import Tuple
from .config import DRAW_DATA_PATH, draw_config
from asyncio.exceptions import TimeoutError
from bs4 import BeautifulSoup
from .util import download_img
from .util import remove_prohibited_str
from urllib.parse import unquote
from utils.http_utils import AsyncHttpx
from nonebot.log import logger
import bs4
import asyncio

try:
    import ujson as json
except ModuleNotFoundError:
    import json

headers = {
    "User-Agent": '"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; TencentTraveler 4.0)"'
}


async def update_simple_info(url: str, game_name: str) -> Tuple[dict, int]:
    info_path = DRAW_DATA_PATH / f"{game_name}.json"
    try:
        with info_path.open("r", encoding="utf8") as f:
            data = json.load(f)
    except (ValueError, FileNotFoundError):
        data = {}
    try:
        response = await AsyncHttpx.get(url, timeout=7)
        soup = BeautifulSoup(response.text, "lxml")
        divs = get_char_divs(soup, game_name)
        for div in divs:
            type_lst = get_type_lst(div, game_name)
            index = 0
            for char_lst in type_lst:
                try:
                    contents = get_char_lst_contents(char_lst, game_name)
                except AttributeError:
                    continue
                for char in contents[1:]:
                    try:
                        data = await retrieve_char_data(
                            char, game_name, data, index
                        )
                    except AttributeError:
                        continue
                index += 1
        data = await _last_check(data, game_name)
    except TimeoutError:
        logger.warning(f"更新 {game_name} 超时...")
        return {}, 999
    with info_path.open("w", encoding="utf8") as wf:
        wf.write(json.dumps(data, ensure_ascii=False, indent=4))
    return data, 200


# 获取所有包含需要图片的divs
def get_char_divs(soup: bs4.BeautifulSoup, game_name: str) -> bs4.element.ResultSet:
    # if game_name == "pcr":
    #     return soup.find_all("div", {"class": "tabbertab"})
    if game_name in ["azur", "pcr"]:
        return soup.find_all("div", {"class": "resp-tabs"})


# 拿到所有类型
def get_type_lst(div: bs4.element.Tag, game_name: str):
    if game_name in ["pcr", "azur"]:
        return div.find("div", {"class": "resp-tabs-container"}).find_all(
            "div", {"class": "resp-tab-content"}
        )


# 获取所有角色div
def get_char_lst_contents(char_lst: bs4.element.Tag, game_name: str):
    contents = []
    # print(len(char_lst.find_all('tr')))
    if game_name == "pcr":
        contents = char_lst.contents
    if game_name == "azur":
        contents = char_lst.find("table").find("tbody").contents[-1].find("td").contents
    return [x for x in contents if x != "\n"]


# 额外数据
async def _last_check(
    data: dict, game_name: str
) -> dict:
    if game_name == "azur":
        idx = 1
        for url in [
            "https://patchwiki.biligame.com/images/blhx/thumb/1/15/pxho13xsnkyb546tftvh49etzdh74cf.png/60px"
            "-舰娘头像外框普通.png",
            "https://patchwiki.biligame.com/images/blhx/thumb/a/a9/k8t7nx6c8pan5vyr8z21txp45jxeo66.png/60px"
            "-舰娘头像外框稀有.png",
            "https://patchwiki.biligame.com/images/blhx/thumb/a/a5/5whkzvt200zwhhx0h0iz9qo1kldnidj.png/60px"
            "-舰娘头像外框精锐.png",
            "https://patchwiki.biligame.com/images/blhx/thumb/a/a2/ptog1j220x5q02hytpwc8al7f229qk9.png/60px-"
            "舰娘头像外框超稀有.png",
        ]:
            await download_img(url, "azur", f"{idx}_star")
            idx += 1
        tasks = []
        semaphore = asyncio.Semaphore(draw_config.SEMAPHORE)
        for key in data.keys():
            tasks.append(
                asyncio.ensure_future(
                    _async_update_azur_extra_info(key, semaphore)
                )
            )
        result = await asyncio.gather(*tasks)
        for x in result:
            for key in x.keys():
                data[key]["获取途径"] = x[key]["获取途径"]
    return data


azur_type = {
    "0": "驱逐",
    "1": "轻巡",
    "2": "重巡",
    "3": "超巡",
    "4": "战巡",
    "5": "战列",
    "6": "航母",
    "7": "航站",
    "8": "轻航",
    "9": "重炮",
    "10": "维修",
    "11": "潜艇",
    "12": "运输",
}


# 整理数据
async def retrieve_char_data(
    char: bs4.element.Tag,
    game_name: str,
    data: dict,
    index: int = 0,
) -> dict:
    member_dict = {}
    if game_name == "pcr":
        member_dict = {
            "头像": unquote(char.find("a").find("img")["src"]),
            "名称": remove_prohibited_str(char.find("a")["title"]),
            "星级": 3 - index,
        }
    if game_name == "azur":
        char = char.find("div").find("div").find("div")
        avatar_img = char.find("a").find("img")
        char = char.find("div")
        try:
            member_dict["名称"] = remove_prohibited_str(char.find("a")["title"])
        except TypeError:
            member_dict["名称"] = char.find("a")["title"][:-4]
        try:
            member_dict["头像"] = unquote(str(avatar_img["srcset"]).split(" ")[-2])
        except KeyError:
            member_dict["头像"] = unquote(str(avatar_img["src"]).split(" ")[-2])
        except TypeError:
            member_dict["头像"] = "img link not find..."
            logger.warning(f'{member_dict["名称"]} 图片缺失....')
        star = char.find("img")["alt"]
        if star == "舰娘头像外框普通.png":
            star = 1
        elif star == "舰娘头像外框稀有.png":
            star = 2
        elif star == "舰娘头像外框精锐.png":
            star = 3
        elif star == "舰娘头像外框超稀有.png":
            star = 4
        elif star == "舰娘头像外框海上传奇.png":
            star = 5
        elif star in [
            "舰娘头像外框最高方案.png",
            "舰娘头像外框决战方案.png",
            "舰娘头像外框超稀有META.png",
            "舰娘头像外框精锐META.png",
        ]:
            star = 6
        else:
            star = 6
        member_dict["星级"] = star
        member_dict["类型"] = azur_type[str(index)]
    await download_img(member_dict["头像"], game_name, member_dict["名称"])
    data[member_dict["名称"]] = member_dict
    logger.info(f'{member_dict["名称"]} is update...')
    return data


async def _async_update_azur_extra_info(
    key: str, semaphore
):
    if key[-1] == "改":
        return {key: {"获取途径": ["无法建造"]}}
    async with semaphore:
        for i in range(20):
            try:
                res = await AsyncHttpx.get(f"https://wiki.biligame.com/blhx/{key}", timeout=7)
                soup = BeautifulSoup(res.text, "lxml")
                try:
                    construction_time = str(
                        soup.find("table", {"class": "wikitable sv-general"}).find(
                            "tbody"
                        )
                    )
                    x = {key: {"获取途径": []}}
                    if construction_time.find("无法建造") != -1:
                        x[key]["获取途径"].append("无法建造")
                    elif construction_time.find("活动已关闭") != -1:
                        x[key]["获取途径"].append("活动限定")
                    else:
                        x[key]["获取途径"].append("可以建造")
                    logger.info(f'碧蓝航线获取额外信息 {key}...{x[key]["获取途径"]}')
                except AttributeError:
                    x = {key: {"获取途径": []}}
                    logger.warning(f"碧蓝航线获取额外信息错误 {key}...{[]}")
                return x
            except TimeoutError:
                logger.warning(
                    f"访问 https://wiki.biligame.com/blhx/{key} 第 {i}次 超时...已再次访问"
                )
    return {}