文章 - 30天尝试新事情

pyppeteer 在AppData下的dev_profile 生成大量文件

pyppeteer

具体路径在：
C:\Users\xda\AppData\Local\pyppeteer\pyppeteer\.dev_profile
运行次数多了，这个目录下积累了几十个G的文件。

因为每次启动pyppeteer后，如果不指定userData目录，会在dev_profile生成一个新的userData目录，每次大概30MB左右的打小，所以启动的次数，越多，这个文件夹的体积就越大。
其实可以直接删除，然后启动pyppeteer是加上一个参数：userDataDir

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         # 'enable-automation':False,

         # 'ignoreDefaultArgs':['--enable-automation'],

         'ignoreDefaultArgs':True,

         }

userDataDir='D:\Temp'
这样每次pyppeteer都会用同一个配置文件，并且还可以把cookies，session文件存在同一个地方，如果登录过的网站，下次可以直接登录，不需要再次输入账号密码。

继续阅读 »

具体路径在：
C:\Users\xda\AppData\Local\pyppeteer\pyppeteer\.dev_profile
运行次数多了，这个目录下积累了几十个G的文件。

因为每次启动pyppeteer后，如果不指定userData目录，会在dev_profile生成一个新的userData目录，每次大概30MB左右的打小，所以启动的次数，越多，这个文件夹的体积就越大。
其实可以直接删除，然后启动pyppeteer是加上一个参数：userDataDir

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         # 'enable-automation':False,

         # 'ignoreDefaultArgs':['--enable-automation'],

         'ignoreDefaultArgs':True,

         }

userDataDir='D:\Temp'
这样每次pyppeteer都会用同一个配置文件，并且还可以把cookies，session文件存在同一个地方，如果登录过的网站，下次可以直接登录，不需要再次输入账号密码。

收起阅读 »

哪些证券开户可以免5

券商开户万一免五

笔者手头有2家券商可以免五开户，股票费率万分之一，免五，没有最低，买多少算多少，比如买1千块就只收1毛钱。

转债，基金ETF这些也都是免五。支持同花顺，支持条件单。并且基金申购有一折

需要的朋友可以联系下方二维码开户：备注：开户，不然会不通过哦

继续阅读 »

笔者手头有2家券商可以免五开户，股票费率万分之一，免五，没有最低，买多少算多少，比如买1千块就只收1毛钱。

转债，基金ETF这些也都是免五。支持同花顺，支持条件单。并且基金申购有一折

需要的朋友可以联系下方二维码开户：备注：开户，不然会不通过哦

收起阅读 »

pip install peewee ： AttributeError: 'str' object has no attribute 'decode'

python

    ERROR: Command errored out with exit status 1:

     command: 'C:\anaconda\python.exe' -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'C:\\Users\\xda\\AppData\

\Local\\Temp\\pip-install-ftotbzih\\peewee\\setup.py'"'"'; __file__='"'"'C:\\Users\\xda\\AppData\\Local\\Temp\\pip-insta

ll-ftotbzih\\peewee\\setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"

'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base 'C:\Users\xda\AppData\Lo

cal\Temp\pip-pip-egg-info-8ou7yi3i'

         cwd: C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\

    Complete output (15 lines):

    Traceback (most recent call last):

      File "<string>", line 1, in <module>

      File "C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\setup.py", line 99, in <module>

        elif not _have_sqlite_extension_support():

      File "C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\setup.py", line 76, in _have_sqlite_extension_su

pport

        compiler.compile([src_file], output_dir=tmp_dir),

      File "C:\anaconda\lib\distutils\_msvccompiler.py", line 327, in compile

        self.initialize()

      File "C:\anaconda\lib\distutils\_msvccompiler.py", line 224, in initialize

        vc_env = _get_vc_env(plat_spec)

      File "C:\anaconda\lib\site-packages\setuptools\msvc.py", line 314, in msvc14_get_vc_env

        return _msvc14_get_vc_env(plat_spec)

      File "C:\anaconda\lib\site-packages\setuptools\msvc.py", line 273, in _msvc14_get_vc_env

        out = subprocess.check_output(

    AttributeError: 'str' object has no attribute 'decode'

    ----------------------------------------

ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.

同样的编码问题，同样的解决方法：
找到文件msvc.py
大概在276行：

        out = subprocess.check_output(

            'cmd /u /c "{}" {} && set'.format(vcvarsall, plat_spec),

            stderr=subprocess.STDOUT,

        )

        # ).decode('utf-16le', errors='replace')

把decode的部分注释掉即可

继续阅读 »

    ERROR: Command errored out with exit status 1:

     command: 'C:\anaconda\python.exe' -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'C:\\Users\\xda\\AppData\

\Local\\Temp\\pip-install-ftotbzih\\peewee\\setup.py'"'"'; __file__='"'"'C:\\Users\\xda\\AppData\\Local\\Temp\\pip-insta

ll-ftotbzih\\peewee\\setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"

'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base 'C:\Users\xda\AppData\Lo

cal\Temp\pip-pip-egg-info-8ou7yi3i'

         cwd: C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\

    Complete output (15 lines):

    Traceback (most recent call last):

      File "<string>", line 1, in <module>

      File "C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\setup.py", line 99, in <module>

        elif not _have_sqlite_extension_support():

      File "C:\Users\xda\AppData\Local\Temp\pip-install-ftotbzih\peewee\setup.py", line 76, in _have_sqlite_extension_su

pport

        compiler.compile([src_file], output_dir=tmp_dir),

      File "C:\anaconda\lib\distutils\_msvccompiler.py", line 327, in compile

        self.initialize()

      File "C:\anaconda\lib\distutils\_msvccompiler.py", line 224, in initialize

        vc_env = _get_vc_env(plat_spec)

      File "C:\anaconda\lib\site-packages\setuptools\msvc.py", line 314, in msvc14_get_vc_env

        return _msvc14_get_vc_env(plat_spec)

      File "C:\anaconda\lib\site-packages\setuptools\msvc.py", line 273, in _msvc14_get_vc_env

        out = subprocess.check_output(

    AttributeError: 'str' object has no attribute 'decode'

    ----------------------------------------

ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.

同样的编码问题，同样的解决方法：
找到文件msvc.py
大概在276行：

        out = subprocess.check_output(

            'cmd /u /c "{}" {} && set'.format(vcvarsall, plat_spec),

            stderr=subprocess.STDOUT,

        )

        # ).decode('utf-16le', errors='replace')

把decode的部分注释掉即可
收起阅读 »

招商证券可以办万一免5吗

券商开户万一免五

最近不少读者朋友咨询招商证券的万一免五开户。
刚好最近有有个招商证券的营业部可以提供这个费率（万一免五），因为本身对大券商而言，万一的费率已经很难的了，况且还可以免5。

不过招商证券的免五需要一定的入金条件，并且可以有不同的档位，有万1.5免五，万1.2免五，万1免五

如果需要的，可以扫描一下二维码咨询开户。
另外还有其他多个券商可供选择，大小券商都有，费率保证同行最低，任君选择。

请备注开户，非诚无扰。

继续阅读 »

最近不少读者朋友咨询招商证券的万一免五开户。
刚好最近有有个招商证券的营业部可以提供这个费率（万一免五），因为本身对大券商而言，万一的费率已经很难的了，况且还可以免5。

不过招商证券的免五需要一定的入金条件，并且可以有不同的档位，有万1.5免五，万1.2免五，万1免五

如果需要的，可以扫描一下二维码咨询开户。
另外还有其他多个券商可供选择，大小券商都有，费率保证同行最低，任君选择。

请备注开户，非诚无扰。

收起阅读 »

特斯拉水军还挺多的还是友商的高级黑呢

闲聊

天天上头条，然后评论里第一点赞最多的
独家对话上海维权女车主：请特斯拉到事发路段实地测速

这么明显的水军，会不会是友商一起黑呢
毕竟国内的电车厂商背后的财团应该比特斯拉大得多。纯粹猜测。
反正对特斯拉没有好感，这个明显是软件设计的bug。
很早前就有了。只是一只就没改过来。
刹车时系统回收电力，系统来减速，这个时候人再去踩一下刹车，实际控制权在电脑端，电脑在刹车回收能源，这时人就别出来控制我。只是这时电脑判断有问题了，来不及急刹车。

继续阅读 »

天天上头条，然后评论里第一点赞最多的
独家对话上海维权女车主：请特斯拉到事发路段实地测速

这么明显的水军，会不会是友商一起黑呢
毕竟国内的电车厂商背后的财团应该比特斯拉大得多。纯粹猜测。
反正对特斯拉没有好感，这个明显是软件设计的bug。
很早前就有了。只是一只就没改过来。
刹车时系统回收电力，系统来减速，这个时候人再去踩一下刹车，实际控制权在电脑端，电脑在刹车回收能源，这时人就别出来控制我。只是这时电脑判断有问题了，来不及急刹车。收起阅读 »

python 破解谷歌人机验证码运用百度语音识别

谷歌人机验证码验证码

谷歌人机交互页面：
https://www.recaptcha.net/recaptcha/api2/demo

如果直接从图片肝，需要收集足够的图片，然后使用yolo或者pytorch进行训练，得到模型后再进行识别。

不过这个人机交互验证码有一个语音验证的功能。

只要点击一个耳机的图标，然后就变成了语音识别。
播放一段录音，然后输入几个单词，如果单词对了，那么也可以通过。

那接下来的问题就简单了，拿到录音->识别录音，转化为文本，然后在输入框输入，就基本大功告成了。

英文转文本，网上有不少的AI平台可以白嫖，不过论效果，个人觉得百度的AI效果还不错，起码可以免费调用5W次。

完整代码如下：

这个是百度识别语音部分：

# -*- coding: utf-8 -*-

# @Time : 2021/4/24 20:50

# @File : baidu_voice_service.py

# @Author : Rocky C@www.30daydo.com



import os

import time



import requests

import sys

import pickle

sys.path.append('..')

from config import API_KEY,SECRET_KEY

from base64 import b64encode

from pathlib import PurePath

import subprocess



BASE = PurePath(__file__).parent



# 需要识别的文件

# 文件格式

# 文件后缀只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式



CUID = '24057753' # 随意

# 采样率

RATE = 16000  # 固定值





ASR_URL = 'http://vop.baidu.com/server_api'



#测试自训练平台需要打开以下信息， 自训练平台模型上线后，您会看见 第二步：“”获取专属模型参数pid:8001，modelid:1234”，按照这个信息获取 dev_pid=8001，lm_id=1234

'''

http://vop.baidu.com/server_api

1537	普通话(纯中文识别)	输入法模型	有标点	支持自定义词库

1737	英语	英语模型	无标点	不支持自定义词库

1637	粤语	粤语模型	有标点	不支持自定义词库

1837	四川话	四川话模型	有标点	不支持自定义词库

1936	普通话远场

'''

DEV_PID = 1737



SCOPE = 'brain_enhanced_asr'  # 有此scope表示有asr能力，没有请在网页里开通极速版





class DemoError(Exception):

    pass





TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token'



def fetch_token():



    params = {'grant_type': 'client_credentials',

              'client_id': API_KEY,

              'client_secret': SECRET_KEY}

    r = requests.post(

        url=TOKEN_URL,

        data=params

    )



    result = r.json()

    if ('access_token' in result.keys() and 'scope' in result.keys()):

        if SCOPE and (not SCOPE in result['scope'].split(' ')):  # SCOPE = False 忽略检查

            raise DemoError('scope is not correct')



        return result['access_token']



    else:

        raise DemoError('MAYBE API_KEY or SECRET_KEY not correct: access_token or scope not found in token response')





"""  TOKEN end """



def dump_token(token):

    with open(os.path.join(BASE,'token.pkl'),'wb') as fp:

        pickle.dump({'token':token},fp)



def load_token(filename):



    if not os.path.exists(filename):

        token=fetch_token()

        dump_token(token)

        return token

    else:

        with open(filename,'rb') as fp:

            token = pickle.load(fp)

            return token['token']



def recognize_service(token,filename):

    FORMAT = filename[-3:]

    with open(filename, 'rb') as speech_file:

        speech_data = speech_file.read()



    length = len(speech_data)

    if length == 0:

        raise DemoError('file %s length read 0 bytes' % filename)



    b64_data = b64encode(speech_data)

    params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID,'speech':b64_data,'len':length,'format':FORMAT,'rate':RATE,'channel':1}



    headers = {

        'Content-Type':'application/json',

    }

    r = requests.post(url=ASR_URL,json=params,headers=headers)

    return r.json()



def rate_convertor(filename):

    filename = filename.split('.')[0]

    CMD=f'ffmpeg.exe -y -i {filename}.mp3 -ac 1 -ar 16000 {filename}.wav'

    try:

        p=subprocess.Popen(CMD, stdin=subprocess.PIPE)

        p.communicate()

        time.sleep(1)

    except Exception as e:

        print(e)

        return False,None

    else:

        return True,f'{filename}.wav'



def clear(file):

    try:

        os.remove(file)

    except Exception as e:

        print(e)



def get_voice_text(audio_file):



    filename = 'token.pkl'

    token = load_token(filename)

    convert_status,file = rate_convertor(audio_file)

    clear(file)

    if not convert_status:

        return None



    result = recognize_service(token,file)



    return result['result'][0]



if __name__ == '__main__':

    get_voice_text('1.mp3')

然后下面的是获取语音部分，并且点击输入结果。

# -*- coding: utf-8 -*-

# @Time : 2021/4/25 15:16

# @File : download_mp3.py

# @Author : Rocky C@www.30daydo.com







#!/usr/bin/env python3

import os

import subprocess

import time

import re

import requests

import urllib.request

import zipfile

import io

from google.cloud import speech_v1

from random import randint, uniform

from bs4 import BeautifulSoup

from selenium import webdriver

from selenium.common.exceptions import NoSuchElementException

from selenium.webdriver.common.by import By

from selenium.webdriver.common.action_chains import ActionChains

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.support.ui import WebDriverWait

from google_recaptcha.baidu_voice_service import get_voice_text,clear





class Gcaptcha:



    def __init__(self, url):

        self.response = None



        self.attempts = 0

        self.successful = 0

        self.failed = 0

        self.solved = 0



        self.mp3 = 'audio.mp3'

        # self.wav='audio.wav'



        # Set Chrome to run in headless mode and mute the audio

        opts = webdriver.ChromeOptions()

        # opts.headless = True

        opts.add_argument("--mute-audio")

        # opts.add_argument("--headless",)



      

        CHROME_PATH = r'C:\git\EZProject\bin\chromedriver.exe'

        self.driver = webdriver.Chrome(executable_path=CHROME_PATH,options=opts)

        self.driver.maximize_window()

        self.driver.get(url)

        self.__bypass_webdriver_check()



        # Initialize gcaptcha solver

        self.__initialize()



        while True:

            # Download MP3 file

            mp3_file = self.__download_mp3()



            # Transcribe MP3 file

            result = get_voice_text(self.mp3)



            # audio_transcription = transcribe(mp3_file)

            # self.transcription.attempts += 1



            # If the MP3 file is properly transcribed

            if result is not None:

                # self.transcription.successful += 1



                # Verify transcription

                verify = self.__submit_transcription(result)



                # Transcription successful with confidence >60%

                if verify:

                    gcaptcha_response = self.__get_response()

                    self.response = gcaptcha_response

                    # self.recaptcha.solved += 1



                    # Delete MP3 file



                    self.driver.close()

                    self.driver.quit()

                    break

                # Multiple correct solutions required. Solving again.

                else:

                    self.solved += 1

                    clear(self.mp3)



            # If the MP3 file could not be transcribed

            else:

                self.failed += 1

                clear(self.mp3)



                # Click on the "Get a new challenge" button to use a new MP3 file

                self.__refresh_mp3()

                # time.sleep(uniform(2, 4))







    def __initialize(self):

        # Access initial gcaptcha iframe

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=a]'))

        self.__bypass_webdriver_check()



        # Click the gcaptcha checkbox

        checkbox = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-anchor')

        self.__mouse_click(checkbox)



        # Go back to original content to access second gcaptcha iframe

        self.driver.switch_to.default_content()



        # Wait roughly 3 seconds for second gcaptcha iframe to load

        time.sleep(uniform(2.5, 3))



        # Find second gcaptcha iframe

        gcaptcha = WebDriverWait(self.driver, 10).until(

            EC.presence_of_element_located((By.CSS_SELECTOR, 'iframe[name^=c]'))

        )



        # Access second gcaptcha iframe

        self.driver.switch_to.frame(gcaptcha)

        self.__bypass_webdriver_check()



        # Click the audio button

        audio_button = WebDriverWait(self.driver, 10).until(

            EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-button-audio'))

        )

        self.__mouse_click(audio_button)

        time.sleep(0.5)



    def __mouse_click(self, element):

        cursor = ActionChains(self.driver)

        cursor.move_to_element(element)

        cursor.pause(uniform(0.3, 0.5))

        cursor.click()

        cursor.perform()



    def __bypass_webdriver_check(self):

        self.driver.execute_script(

            'const newProto = navigator.__proto__; delete newProto.webdriver; navigator.__proto__ = newProto;')



    def __download_mp3(self):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Check if the Google servers are blocking us

        if len(self.driver.find_elements(By.CSS_SELECTOR, '.rc-doscaptcha-body-text')) == 0:

            audio_file = WebDriverWait(self.driver, 10).until(

                EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-audiochallenge-tdownload-link'))

            )



            # Click the play button

            play_button = WebDriverWait(self.driver, 10).until(

                EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-audiochallenge-play-button > button'))

            )

            self.__mouse_click(play_button)



            # Get URL of MP3 file

            audio_url = audio_file.get_attribute('href')



            # Predefine the MP3 file name



            # Download the MP3 file

            try:

                urllib.request.urlretrieve(audio_url, self.mp3)

            except Exception as e:

                print(e)

                return None

            else:

                return self.mp3

        else:

            Error('Too many requests have been sent to Google. You are currently being blocked by their servers.')

            exit(-1)



    def __refresh_mp3(self):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Click on the refresh button to retrieve a new mp3 file

        refresh_button = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-reload-button')

        self.__mouse_click(refresh_button)



    def __submit_transcription(self, text):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Input field for response

        input_field = self.driver.find_element(By.CSS_SELECTOR, '#audio-response')



        # Instantly type the full text without delays because Google isn't checking delays between keystrokes

        input_field.send_keys(text)



        # Click "Verify" button

        verify_button = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-verify-button')

        self.__mouse_click(verify_button)



        # Wait roughly 3 seconds for verification to complete

        time.sleep(uniform(2, 3))



        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=a]'))

        self.__bypass_webdriver_check()



        # Check to see if verified by recaptcha

        try:

            self.driver.find_element(By.CSS_SELECTOR, '.recaptcha-checkbox-checked')

        except NoSuchElementException:

            return False

        else:

            return True



    def __get_response(self):

        # Switch back to main parent window and get gcaptcha response

        self.driver.switch_to.default_content()

        response = self.driver.find_element(By.CSS_SELECTOR, '#g-recaptcha-response').get_attribute('value')

        return response





class Error(Exception):

    def __init__(self, message):

        get_files = os.listdir()

        match_regex = re.compile(r'^audio\d+.mp3|chromedriver_\w+\d+.zip$')

        filtered_files = [f for f in get_files if match_regex.match(f)]



        for file in filtered_files:

            clear(file)



        raise Exception(f'ERROR: {message}')





if __name__=='__main__':

    gcaptcha = Gcaptcha('https://www.google.com/recaptcha/api2/demo')

代码里需要你申请一个百度AI的key以便生成token。
最终试了，效果还是达到98%的准确率。

继续阅读 »

谷歌人机交互页面：
https://www.recaptcha.net/recaptcha/api2/demo

如果直接从图片肝，需要收集足够的图片，然后使用yolo或者pytorch进行训练，得到模型后再进行识别。

不过这个人机交互验证码有一个语音验证的功能。

只要点击一个耳机的图标，然后就变成了语音识别。
播放一段录音，然后输入几个单词，如果单词对了，那么也可以通过。

那接下来的问题就简单了，拿到录音->识别录音，转化为文本，然后在输入框输入，就基本大功告成了。

英文转文本，网上有不少的AI平台可以白嫖，不过论效果，个人觉得百度的AI效果还不错，起码可以免费调用5W次。

完整代码如下：

这个是百度识别语音部分：

# -*- coding: utf-8 -*-

# @Time : 2021/4/24 20:50

# @File : baidu_voice_service.py

# @Author : Rocky C@www.30daydo.com



import os

import time



import requests

import sys

import pickle

sys.path.append('..')

from config import API_KEY,SECRET_KEY

from base64 import b64encode

from pathlib import PurePath

import subprocess



BASE = PurePath(__file__).parent



# 需要识别的文件

# 文件格式

# 文件后缀只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式



CUID = '24057753' # 随意

# 采样率

RATE = 16000  # 固定值





ASR_URL = 'http://vop.baidu.com/server_api'



#测试自训练平台需要打开以下信息， 自训练平台模型上线后，您会看见 第二步：“”获取专属模型参数pid:8001，modelid:1234”，按照这个信息获取 dev_pid=8001，lm_id=1234

'''

http://vop.baidu.com/server_api

1537	普通话(纯中文识别)	输入法模型	有标点	支持自定义词库

1737	英语	英语模型	无标点	不支持自定义词库

1637	粤语	粤语模型	有标点	不支持自定义词库

1837	四川话	四川话模型	有标点	不支持自定义词库

1936	普通话远场

'''

DEV_PID = 1737



SCOPE = 'brain_enhanced_asr'  # 有此scope表示有asr能力，没有请在网页里开通极速版





class DemoError(Exception):

    pass





TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token'



def fetch_token():



    params = {'grant_type': 'client_credentials',

              'client_id': API_KEY,

              'client_secret': SECRET_KEY}

    r = requests.post(

        url=TOKEN_URL,

        data=params

    )



    result = r.json()

    if ('access_token' in result.keys() and 'scope' in result.keys()):

        if SCOPE and (not SCOPE in result['scope'].split(' ')):  # SCOPE = False 忽略检查

            raise DemoError('scope is not correct')



        return result['access_token']



    else:

        raise DemoError('MAYBE API_KEY or SECRET_KEY not correct: access_token or scope not found in token response')





"""  TOKEN end """



def dump_token(token):

    with open(os.path.join(BASE,'token.pkl'),'wb') as fp:

        pickle.dump({'token':token},fp)



def load_token(filename):



    if not os.path.exists(filename):

        token=fetch_token()

        dump_token(token)

        return token

    else:

        with open(filename,'rb') as fp:

            token = pickle.load(fp)

            return token['token']



def recognize_service(token,filename):

    FORMAT = filename[-3:]

    with open(filename, 'rb') as speech_file:

        speech_data = speech_file.read()



    length = len(speech_data)

    if length == 0:

        raise DemoError('file %s length read 0 bytes' % filename)



    b64_data = b64encode(speech_data)

    params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID,'speech':b64_data,'len':length,'format':FORMAT,'rate':RATE,'channel':1}



    headers = {

        'Content-Type':'application/json',

    }

    r = requests.post(url=ASR_URL,json=params,headers=headers)

    return r.json()



def rate_convertor(filename):

    filename = filename.split('.')[0]

    CMD=f'ffmpeg.exe -y -i {filename}.mp3 -ac 1 -ar 16000 {filename}.wav'

    try:

        p=subprocess.Popen(CMD, stdin=subprocess.PIPE)

        p.communicate()

        time.sleep(1)

    except Exception as e:

        print(e)

        return False,None

    else:

        return True,f'{filename}.wav'



def clear(file):

    try:

        os.remove(file)

    except Exception as e:

        print(e)



def get_voice_text(audio_file):



    filename = 'token.pkl'

    token = load_token(filename)

    convert_status,file = rate_convertor(audio_file)

    clear(file)

    if not convert_status:

        return None



    result = recognize_service(token,file)



    return result['result'][0]



if __name__ == '__main__':

    get_voice_text('1.mp3')

然后下面的是获取语音部分，并且点击输入结果。

# -*- coding: utf-8 -*-

# @Time : 2021/4/25 15:16

# @File : download_mp3.py

# @Author : Rocky C@www.30daydo.com







#!/usr/bin/env python3

import os

import subprocess

import time

import re

import requests

import urllib.request

import zipfile

import io

from google.cloud import speech_v1

from random import randint, uniform

from bs4 import BeautifulSoup

from selenium import webdriver

from selenium.common.exceptions import NoSuchElementException

from selenium.webdriver.common.by import By

from selenium.webdriver.common.action_chains import ActionChains

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.support.ui import WebDriverWait

from google_recaptcha.baidu_voice_service import get_voice_text,clear





class Gcaptcha:



    def __init__(self, url):

        self.response = None



        self.attempts = 0

        self.successful = 0

        self.failed = 0

        self.solved = 0



        self.mp3 = 'audio.mp3'

        # self.wav='audio.wav'



        # Set Chrome to run in headless mode and mute the audio

        opts = webdriver.ChromeOptions()

        # opts.headless = True

        opts.add_argument("--mute-audio")

        # opts.add_argument("--headless",)



      

        CHROME_PATH = r'C:\git\EZProject\bin\chromedriver.exe'

        self.driver = webdriver.Chrome(executable_path=CHROME_PATH,options=opts)

        self.driver.maximize_window()

        self.driver.get(url)

        self.__bypass_webdriver_check()



        # Initialize gcaptcha solver

        self.__initialize()



        while True:

            # Download MP3 file

            mp3_file = self.__download_mp3()



            # Transcribe MP3 file

            result = get_voice_text(self.mp3)



            # audio_transcription = transcribe(mp3_file)

            # self.transcription.attempts += 1



            # If the MP3 file is properly transcribed

            if result is not None:

                # self.transcription.successful += 1



                # Verify transcription

                verify = self.__submit_transcription(result)



                # Transcription successful with confidence >60%

                if verify:

                    gcaptcha_response = self.__get_response()

                    self.response = gcaptcha_response

                    # self.recaptcha.solved += 1



                    # Delete MP3 file



                    self.driver.close()

                    self.driver.quit()

                    break

                # Multiple correct solutions required. Solving again.

                else:

                    self.solved += 1

                    clear(self.mp3)



            # If the MP3 file could not be transcribed

            else:

                self.failed += 1

                clear(self.mp3)



                # Click on the "Get a new challenge" button to use a new MP3 file

                self.__refresh_mp3()

                # time.sleep(uniform(2, 4))







    def __initialize(self):

        # Access initial gcaptcha iframe

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=a]'))

        self.__bypass_webdriver_check()



        # Click the gcaptcha checkbox

        checkbox = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-anchor')

        self.__mouse_click(checkbox)



        # Go back to original content to access second gcaptcha iframe

        self.driver.switch_to.default_content()



        # Wait roughly 3 seconds for second gcaptcha iframe to load

        time.sleep(uniform(2.5, 3))



        # Find second gcaptcha iframe

        gcaptcha = WebDriverWait(self.driver, 10).until(

            EC.presence_of_element_located((By.CSS_SELECTOR, 'iframe[name^=c]'))

        )



        # Access second gcaptcha iframe

        self.driver.switch_to.frame(gcaptcha)

        self.__bypass_webdriver_check()



        # Click the audio button

        audio_button = WebDriverWait(self.driver, 10).until(

            EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-button-audio'))

        )

        self.__mouse_click(audio_button)

        time.sleep(0.5)



    def __mouse_click(self, element):

        cursor = ActionChains(self.driver)

        cursor.move_to_element(element)

        cursor.pause(uniform(0.3, 0.5))

        cursor.click()

        cursor.perform()



    def __bypass_webdriver_check(self):

        self.driver.execute_script(

            'const newProto = navigator.__proto__; delete newProto.webdriver; navigator.__proto__ = newProto;')



    def __download_mp3(self):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Check if the Google servers are blocking us

        if len(self.driver.find_elements(By.CSS_SELECTOR, '.rc-doscaptcha-body-text')) == 0:

            audio_file = WebDriverWait(self.driver, 10).until(

                EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-audiochallenge-tdownload-link'))

            )



            # Click the play button

            play_button = WebDriverWait(self.driver, 10).until(

                EC.presence_of_element_located((By.CSS_SELECTOR, '.rc-audiochallenge-play-button > button'))

            )

            self.__mouse_click(play_button)



            # Get URL of MP3 file

            audio_url = audio_file.get_attribute('href')



            # Predefine the MP3 file name



            # Download the MP3 file

            try:

                urllib.request.urlretrieve(audio_url, self.mp3)

            except Exception as e:

                print(e)

                return None

            else:

                return self.mp3

        else:

            Error('Too many requests have been sent to Google. You are currently being blocked by their servers.')

            exit(-1)



    def __refresh_mp3(self):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Click on the refresh button to retrieve a new mp3 file

        refresh_button = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-reload-button')

        self.__mouse_click(refresh_button)



    def __submit_transcription(self, text):

        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=c]'))

        self.__bypass_webdriver_check()



        # Input field for response

        input_field = self.driver.find_element(By.CSS_SELECTOR, '#audio-response')



        # Instantly type the full text without delays because Google isn't checking delays between keystrokes

        input_field.send_keys(text)



        # Click "Verify" button

        verify_button = self.driver.find_element(By.CSS_SELECTOR, '#recaptcha-verify-button')

        self.__mouse_click(verify_button)



        # Wait roughly 3 seconds for verification to complete

        time.sleep(uniform(2, 3))



        self.driver.switch_to.default_content()

        self.driver.switch_to.frame(self.driver.find_element(By.CSS_SELECTOR, 'iframe[name^=a]'))

        self.__bypass_webdriver_check()



        # Check to see if verified by recaptcha

        try:

            self.driver.find_element(By.CSS_SELECTOR, '.recaptcha-checkbox-checked')

        except NoSuchElementException:

            return False

        else:

            return True



    def __get_response(self):

        # Switch back to main parent window and get gcaptcha response

        self.driver.switch_to.default_content()

        response = self.driver.find_element(By.CSS_SELECTOR, '#g-recaptcha-response').get_attribute('value')

        return response





class Error(Exception):

    def __init__(self, message):

        get_files = os.listdir()

        match_regex = re.compile(r'^audio\d+.mp3|chromedriver_\w+\d+.zip$')

        filtered_files = [f for f in get_files if match_regex.match(f)]



        for file in filtered_files:

            clear(file)



        raise Exception(f'ERROR: {message}')





if __name__=='__main__':

    gcaptcha = Gcaptcha('https://www.google.com/recaptcha/api2/demo')

代码里需要你申请一个百度AI的key以便生成token。
最终试了，效果还是达到98%的准确率。收起阅读 »

百度英语中文语音识别为文字服务 python demo【使用requests重写官方demo】

python语音转文字 python

官方使用的稍微底层的urllib写的，用过了requests库的人看着不习惯。故重写之，并做了封装。
官方demo：
https://github.com/Baidu-AIP/speech-demo

# -*- coding: utf-8 -*-

# @Time : 2021/4/24 20:50

# @File : baidu_voice_service.py

# @Author : Rocky C@www.30daydo.com



import os

import requests

import sys

import pickle

sys.path.append('..')

from config import API_KEY,SECRET_KEY

from base64 import b64encode

from pathlib import PurePath





BASE = PurePath(__file__).parent



# 需要识别的文件

AUDIO_FILE = r'C:\OtherGit\speech-demo\rest-api-asr\python\audio\2.m4a'  # 只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式

# 文件格式

FORMAT = AUDIO_FILE[-3:]  # 文件后缀只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式



CUID = '24057753'

# 采样率

RATE = 16000  # 固定值





ASR_URL = 'http://vop.baidu.com/server_api'



#测试自训练平台需要打开以下信息， 自训练平台模型上线后，您会看见 第二步：“”获取专属模型参数pid:8001，modelid:1234”，按照这个信息获取 dev_pid=8001，lm_id=1234

'''

http://vop.baidu.com/server_api

1537	普通话(纯中文识别)	输入法模型	有标点	支持自定义词库

1737	英语	英语模型	无标点	不支持自定义词库

1637	粤语	粤语模型	有标点	不支持自定义词库

1837	四川话	四川话模型	有标点	不支持自定义词库

1936	普通话远场

'''

DEV_PID = 1737



SCOPE = 'brain_enhanced_asr'  # 有此scope表示有asr能力，没有请在网页里开通极速版





class DemoError(Exception):

    pass





TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token'



def fetch_token():



    params = {'grant_type': 'client_credentials',

              'client_id': API_KEY,

              'client_secret': SECRET_KEY}

    r = requests.post(

        url=TOKEN_URL,

        data=params

    )



    result = r.json()

    if ('access_token' in result.keys() and 'scope' in result.keys()):

        if SCOPE and (not SCOPE in result['scope'].split(' ')):  # SCOPE = False 忽略检查

            raise DemoError('scope is not correct')



        return result['access_token']



    else:

        raise DemoError('MAYBE API_KEY or SECRET_KEY not correct: access_token or scope not found in token response')





"""  TOKEN end """



def dump_token(token):

    with open(os.path.join(BASE,'token.pkl'),'wb') as fp:

        pickle.dump({'token':token},fp)



def load_token(filename):



    if not os.path.exists(filename):

        token=fetch_token()

        dump_token(token)

        return token

    else:

        with open(filename,'rb') as fp:

            token = pickle.load(fp)

            return token['token']



def recognize_service(token,filename):



    with open(filename, 'rb') as speech_file:

        speech_data = speech_file.read()



    length = len(speech_data)

    if length == 0:

        raise DemoError('file %s length read 0 bytes' % AUDIO_FILE)



    b64_data = b64encode(speech_data)

    params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID,'speech':b64_data,'len':length,'format':FORMAT,'rate':RATE,'channel':1}



    headers = {

        'Content-Type':'application/json',

    }

    r = requests.post(url=ASR_URL,json=params,headers=headers)

    return r.json()





def main():

    filename = 'token.pkl'

    token = load_token(filename)

    result = recognize_service(token,AUDIO_FILE)

    print(result['result'])



if __name__ == '__main__':

    main()

只需要替换自己的key就可以使用。
自己录了几段英文测试了下，还是蛮准的。

继续阅读 »

官方使用的稍微底层的urllib写的，用过了requests库的人看着不习惯。故重写之，并做了封装。
官方demo：
https://github.com/Baidu-AIP/speech-demo

# -*- coding: utf-8 -*-

# @Time : 2021/4/24 20:50

# @File : baidu_voice_service.py

# @Author : Rocky C@www.30daydo.com



import os

import requests

import sys

import pickle

sys.path.append('..')

from config import API_KEY,SECRET_KEY

from base64 import b64encode

from pathlib import PurePath





BASE = PurePath(__file__).parent



# 需要识别的文件

AUDIO_FILE = r'C:\OtherGit\speech-demo\rest-api-asr\python\audio\2.m4a'  # 只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式

# 文件格式

FORMAT = AUDIO_FILE[-3:]  # 文件后缀只支持 pcm/wav/amr 格式，极速版额外支持m4a 格式



CUID = '24057753'

# 采样率

RATE = 16000  # 固定值





ASR_URL = 'http://vop.baidu.com/server_api'



#测试自训练平台需要打开以下信息， 自训练平台模型上线后，您会看见 第二步：“”获取专属模型参数pid:8001，modelid:1234”，按照这个信息获取 dev_pid=8001，lm_id=1234

'''

http://vop.baidu.com/server_api

1537	普通话(纯中文识别)	输入法模型	有标点	支持自定义词库

1737	英语	英语模型	无标点	不支持自定义词库

1637	粤语	粤语模型	有标点	不支持自定义词库

1837	四川话	四川话模型	有标点	不支持自定义词库

1936	普通话远场

'''

DEV_PID = 1737



SCOPE = 'brain_enhanced_asr'  # 有此scope表示有asr能力，没有请在网页里开通极速版





class DemoError(Exception):

    pass





TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token'



def fetch_token():



    params = {'grant_type': 'client_credentials',

              'client_id': API_KEY,

              'client_secret': SECRET_KEY}

    r = requests.post(

        url=TOKEN_URL,

        data=params

    )



    result = r.json()

    if ('access_token' in result.keys() and 'scope' in result.keys()):

        if SCOPE and (not SCOPE in result['scope'].split(' ')):  # SCOPE = False 忽略检查

            raise DemoError('scope is not correct')



        return result['access_token']



    else:

        raise DemoError('MAYBE API_KEY or SECRET_KEY not correct: access_token or scope not found in token response')





"""  TOKEN end """



def dump_token(token):

    with open(os.path.join(BASE,'token.pkl'),'wb') as fp:

        pickle.dump({'token':token},fp)



def load_token(filename):



    if not os.path.exists(filename):

        token=fetch_token()

        dump_token(token)

        return token

    else:

        with open(filename,'rb') as fp:

            token = pickle.load(fp)

            return token['token']



def recognize_service(token,filename):



    with open(filename, 'rb') as speech_file:

        speech_data = speech_file.read()



    length = len(speech_data)

    if length == 0:

        raise DemoError('file %s length read 0 bytes' % AUDIO_FILE)



    b64_data = b64encode(speech_data)

    params = {'cuid': CUID, 'token': token, 'dev_pid': DEV_PID,'speech':b64_data,'len':length,'format':FORMAT,'rate':RATE,'channel':1}



    headers = {

        'Content-Type':'application/json',

    }

    r = requests.post(url=ASR_URL,json=params,headers=headers)

    return r.json()





def main():

    filename = 'token.pkl'

    token = load_token(filename)

    result = recognize_service(token,AUDIO_FILE)

    print(result['result'])



if __name__ == '__main__':

    main()

只需要替换自己的key就可以使用。
自己录了几段英文测试了下，还是蛮准的。收起阅读 »

银河证券拖拉机如何开通一拖六一拖七

银河拖拉机万一免五

首先你得先开通一个银河证券的账户，笔者这里目前开通的费率是股票万一免5，转债沪市百万分之五，深市十万分之五，基金申购打一折，基金买卖费率万0.5，没有最低5元限制。需要可以文末扫描开通。

有了银河证券账户就就可以开通拖拉机了。

效果图如下：

mmexport9638d8867a13634bbc8d9979de1bc45e_1653706320148.png

选择场内基金

mmexport5675253283e5a950f062e8d9407812e8_1653706315625.png

选择基金申购！不要选认购，不要选认购，不要选认购！

选择你要申购的标的代码，比如华宝油气，原油基金折价品种。

笔者公众号内有银河证券的autojs 拖拉机+多账户自动申购脚本，自动卖出脚本

拖拉机开通很简单。

在首页点击开户：

底下有个加挂户的，点击之

然后填入相关的信息。

如果没有开过深基金户的，添加新加，如果已经开过的，那么只要把旧的深基金账户贴上去就可以。
新开的话，一天只能开一个，如果开多次，会提示已经有一个在办理中，继续加挂会有提示错误信息。

收益率，绝对值不高，但是单个标的的收益率绝对高的爆棚

mmexportc171ab7bad4935b43d603bcb1bc44719_1653706282257.jpeg

所以只是套一户的话，就没多大意思了。不过银河就是可以一个账户开6个股东号，也就是以你一个人在限购的情况。所以如果限购500，那么如果一次循环套利收益率50%，250元，6个股东号，收益1500元。然后把家人的身份证拿过来开了户，一个家庭6户，1500*6=9000元，所以理论套利下来，一个家庭收益率就有9000元，如果成员数更多，收益更多。

所以这个套利的核心是一个支持多开股东户的券商，且券商支持申购打折，（不打折的话一次套利会损失1%）多张身份证账户，笔者这里适合的银河券商，股票费率可以做到万一免五，申购一折。

扫描联系开户，备注：开户
非诚勿扰，墨迹勿扰。

继续阅读 »

首先你得先开通一个银河证券的账户，笔者这里目前开通的费率是股票万一免5，转债沪市百万分之五，深市十万分之五，基金申购打一折，基金买卖费率万0.5，没有最低5元限制。需要可以文末扫描开通。

有了银河证券账户就就可以开通拖拉机了。

效果图如下：

选择场内基金

选择基金申购！不要选认购，不要选认购，不要选认购！

选择你要申购的标的代码，比如华宝油气，原油基金折价品种。

笔者公众号内有银河证券的autojs 拖拉机+多账户自动申购脚本，自动卖出脚本

拖拉机开通很简单。

在首页点击开户：

底下有个加挂户的，点击之

然后填入相关的信息。

如果没有开过深基金户的，添加新加，如果已经开过的，那么只要把旧的深基金账户贴上去就可以。
新开的话，一天只能开一个，如果开多次，会提示已经有一个在办理中，继续加挂会有提示错误信息。

收益率，绝对值不高，但是单个标的的收益率绝对高的爆棚

所以只是套一户的话，就没多大意思了。不过银河就是可以一个账户开6个股东号，也就是以你一个人在限购的情况。所以如果限购500，那么如果一次循环套利收益率50%，250元，6个股东号，收益1500元。然后把家人的身份证拿过来开了户，一个家庭6户，1500*6=9000元，所以理论套利下来，一个家庭收益率就有9000元，如果成员数更多，收益更多。

所以这个套利的核心是一个支持多开股东户的券商，且券商支持申购打折，（不打折的话一次套利会损失1%）多张身份证账户，笔者这里适合的银河券商，股票费率可以做到万一免五，申购一折。

扫描联系开户，备注：开户
非诚勿扰，墨迹勿扰。

收起阅读 »

川财证券费率股票万一，转债百万分之二费率最低开户

券商开户

支持同花顺，支持条件单。

因为是小券商，所以平时挂单速度的通道要比网红券商的营业部要快得多。

至于费率，也是目前市场最低。

费率：股票万一，转债（新规）沪：十万分之四点四，深：十万分之八。

两融利率：默认5.99%，最低5.4%

基金ETF费率万0.5。

感兴趣的读者朋友可以稍微下方二维码开户。备注：开户

继续阅读 »

支持同花顺，支持条件单。

因为是小券商，所以平时挂单速度的通道要比网红券商的营业部要快得多。

至于费率，也是目前市场最低。

费率：股票万一，转债（新规）沪：十万分之四点四，深：十万分之八。

两融利率：默认5.99%，最低5.4%

基金ETF费率万0.5。

感兴趣的读者朋友可以稍微下方二维码开户。备注：开户

收起阅读 »

基金常见误区

基金套利

1. C类规模一定比A大吗：
错，只能说明大部分情况下是这样，不过实际上查了下相关的基金数据，C类也会比A类的规模大。
比如这两只：

直接买入红利增强与易基综债【2021-04-22】

套利

试验一下策略的灵敏度。
收盘再来更新一波。

### 盘后更新 #####
当天两个都埋伏失败。。。看看明天的情况。如果没拉升，平盘卖出，如果暴跌，则7天后选择赎回。

pymongo update_one/update_many 返回更新数据的数目

pymongo python

比如有以下的python语句

ret = self.doc.update_one({'announcementId':announcementId},{'$setOnInsert':item},upsert=True)

作用是如果某个id不存在时，则把数据插入文档，如果存在，则不进行任何操作。

那么ret是操作的返回结果。
我们可以对返回数据进行核对

ret.matched_count, ret.modified_count

前者是匹配到文档的数目，而后者是修改了文档的个数。

继续阅读 »

比如有以下的python语句

ret = self.doc.update_one({'announcementId':announcementId},{'$setOnInsert':item},upsert=True)

作用是如果某个id不存在时，则把数据插入文档，如果存在，则不进行任何操作。

那么ret是操作的返回结果。
我们可以对返回数据进行核对

ret.matched_count, ret.modified_count

前者是匹配到文档的数目，而后者是修改了文档的个数。

收起阅读 »

南方聚利160131 开放申购 2021年5月14日

套利

当前的溢价率其高，当前溢价率是150%。

大概率是基金公司在做局，让你们进去套利的啦。

不过目前该基金的规模在5千万，看起来规模不算特别大，并且是一只债基。

跟520弘盈差不多的套路。

轻报APP --骗子请注意点

闲聊

所谓的垃圾创业公司，什么业务都不想出钱，能省就剩，抠到极致，能骗的绝对不花钱。

第一次见这种公司。

事情缘由：

该公司在拉勾上以招聘兼职为由，加你微信，然后借口说已测试一下应聘者的的水平，要求对方写一个爬取一个他们想要爬的网站，而且是用一个第三方的网站神箭手的平台代码来写的。意味着，他可以拿着你的代码直接在上面运行，爬取他们想要的数据。

因为他们要的网站我曾经爬过，我直接把数据接了图给他们。他们就急着要我用神箭手重新写一次。这时我就妥妥地确定他们就是想要空手白狼的人。然后就拉黑了哦。

注意，那个负责人叫王锦锋。

继续阅读 »

所谓的垃圾创业公司，什么业务都不想出钱，能省就剩，抠到极致，能骗的绝对不花钱。

第一次见这种公司。

事情缘由：

该公司在拉勾上以招聘兼职为由，加你微信，然后借口说已测试一下应聘者的的水平，要求对方写一个爬取一个他们想要爬的网站，而且是用一个第三方的网站神箭手的平台代码来写的。意味着，他可以拿着你的代码直接在上面运行，爬取他们想要的数据。

因为他们要的网站我曾经爬过，我直接把数据接了图给他们。他们就急着要我用神箭手重新写一次。这时我就妥妥地确定他们就是想要空手白狼的人。然后就拉黑了哦。

注意，那个负责人叫王锦锋。收起阅读 »

本地代码搜索脚本 python实现

python

本来用find+grep可以搞定的，不过如果搜索多个路径和多个规则，写正则可能写过不来

find . -type f -name "*.py" | xargs grep "redis"

上面语句是在py文件中查找redis的字符。

不过如果要在指定多个位置查找，可能要拼接几个管道，并且如果我要几个字符的关系是并集，就是多个关键字要在文本中同时出现，而且不一定在同一行，所以也不好写。

所以写了个python脚本，也方便在centos下运行

# -*- coding: utf-8 -*-

# @Time : 2021/4/14 1:46

# @File : search_string_in_folder.py

# @Author : Rocky C@www.30daydo.com



'''

搜索代码脚本

'''

import fire

import glob

import re



# TODO 用PYQT重写一个



PATH_LIST = [r'C:\git\\',r'C:\OtherGit\\',r'C:\OneDrive\viewed_code\\']

POST_FIX = 'py' # 后缀文件

# 关键词

WORDS=[]



EXCLUDE_PATH=[r'C:\OtherGit\cpython']



DEBUG = True



class FileSearcher:



    def __init__(self,kw):

        self.root_path_list = PATH_LIST

        self.default_coding ='utf-8'

        self.exception_handle_coding='gbk'

        self.kw=[]

        if not isinstance(kw,tuple):

            kw=(kw,)



        for k in kw:

            k=k.strip()

            self.kw.append(k)



    def search(self,file,encoding):

        match_dict = dict()



        for w in self.kw:

            match_dict.setdefault(w, False)



        line_number = 0

        line_list=list()

        with open(file, 'r', encoding=encoding) as fp:



            while 1:

                try:

                    line = fp.readline()



                except UnicodeDecodeError as e:



                    if DEBUG:

                        print(f'Error coding in file {file}')

                        print(e)



                    return None,None,None



                except Exception as e:

                    if DEBUG:

                        print(f'Error in file {file}')

                        print(e)

                    break



                if not line:

                    break



                line = line.strip()

                if not line:

                    continue



                for w in self.kw:

                    m=re.search(w,line,re.IGNORECASE)

                    if m:

                        match_dict.update({w:True})

                        line_list.append(line_number)



                line_number+=1



        return True,match_dict.copy(),line_list.copy()



    def print_match_result(self,file,line_list,encoding):



        with open(file, 'r', encoding=encoding) as fp:

            line_number = 0

            while 1:

                try:

                    line = fp.readline()

                except Exception as e:

                    if DEBUG:

                        print(f'Error in file {file}')

                        print(e)

                    break



                if not line:

                    break

                line=line.strip()



                if not line:

                    continue



                if line_number in line_list:

                    print(f'{file} :: {line_number} ====>\n {line[:50]}\n')



                line_number += 1



    def run(self):

        for path in self.root_path_list:



            search_path=path+'**/*.'+POST_FIX



            for file in glob.iglob(search_path,recursive=True):



                for ex_path in EXCLUDE_PATH:

                    ex_path=ex_path.replace('\\','')

                    temp_file=file.replace('\\','')

                    if ex_path in temp_file:

                        continue



                    use_encoding=self.default_coding

                    encode_proper,match_dict,line_list=self.search(file,use_encoding)



                    if not encode_proper:

                        use_encoding = self.exception_handle_coding

                        encode_proper,match_dict,line_list=self.search(file, use_encoding)



                    if match_dict is not None and len(match_dict)>0 and all(match_dict.values()):

                        # print(match_dict.values())

                        self.print_match_result(file,line_list,use_encoding)

                        # print(line_list)





def test_error_file():

    path=r'C:\git\CodePool\example-code\19-dyn-attr-prop\oscon\schedule2.py'

    with open(path,'r',encoding='utf8') as fp:

        while 1:

            x=fp.readline()

            if not x:

                break

            print(x)



def main(kw):

    app = FileSearcher(kw)

    app.run()



if __name__ == '__main__':

    fire.Fire(main)

运行： python main.py --kw=asyncio,gather

继续阅读 »

本来用find+grep可以搞定的，不过如果搜索多个路径和多个规则，写正则可能写过不来

find . -type f -name "*.py" | xargs grep "redis"

上面语句是在py文件中查找redis的字符。

不过如果要在指定多个位置查找，可能要拼接几个管道，并且如果我要几个字符的关系是并集，就是多个关键字要在文本中同时出现，而且不一定在同一行，所以也不好写。

所以写了个python脚本，也方便在centos下运行

# -*- coding: utf-8 -*-

# @Time : 2021/4/14 1:46

# @File : search_string_in_folder.py

# @Author : Rocky C@www.30daydo.com



'''

搜索代码脚本

'''

import fire

import glob

import re



# TODO 用PYQT重写一个



PATH_LIST = [r'C:\git\\',r'C:\OtherGit\\',r'C:\OneDrive\viewed_code\\']

POST_FIX = 'py' # 后缀文件

# 关键词

WORDS=[]



EXCLUDE_PATH=[r'C:\OtherGit\cpython']



DEBUG = True



class FileSearcher:



    def __init__(self,kw):

        self.root_path_list = PATH_LIST

        self.default_coding ='utf-8'

        self.exception_handle_coding='gbk'

        self.kw=[]

        if not isinstance(kw,tuple):

            kw=(kw,)



        for k in kw:

            k=k.strip()

            self.kw.append(k)



    def search(self,file,encoding):

        match_dict = dict()



        for w in self.kw:

            match_dict.setdefault(w, False)



        line_number = 0

        line_list=list()

        with open(file, 'r', encoding=encoding) as fp:



            while 1:

                try:

                    line = fp.readline()



                except UnicodeDecodeError as e:



                    if DEBUG:

                        print(f'Error coding in file {file}')

                        print(e)



                    return None,None,None



                except Exception as e:

                    if DEBUG:

                        print(f'Error in file {file}')

                        print(e)

                    break



                if not line:

                    break



                line = line.strip()

                if not line:

                    continue



                for w in self.kw:

                    m=re.search(w,line,re.IGNORECASE)

                    if m:

                        match_dict.update({w:True})

                        line_list.append(line_number)



                line_number+=1



        return True,match_dict.copy(),line_list.copy()



    def print_match_result(self,file,line_list,encoding):



        with open(file, 'r', encoding=encoding) as fp:

            line_number = 0

            while 1:

                try:

                    line = fp.readline()

                except Exception as e:

                    if DEBUG:

                        print(f'Error in file {file}')

                        print(e)

                    break



                if not line:

                    break

                line=line.strip()



                if not line:

                    continue



                if line_number in line_list:

                    print(f'{file} :: {line_number} ====>\n {line[:50]}\n')



                line_number += 1



    def run(self):

        for path in self.root_path_list:



            search_path=path+'**/*.'+POST_FIX



            for file in glob.iglob(search_path,recursive=True):



                for ex_path in EXCLUDE_PATH:

                    ex_path=ex_path.replace('\\','')

                    temp_file=file.replace('\\','')

                    if ex_path in temp_file:

                        continue



                    use_encoding=self.default_coding

                    encode_proper,match_dict,line_list=self.search(file,use_encoding)



                    if not encode_proper:

                        use_encoding = self.exception_handle_coding

                        encode_proper,match_dict,line_list=self.search(file, use_encoding)



                    if match_dict is not None and len(match_dict)>0 and all(match_dict.values()):

                        # print(match_dict.values())

                        self.print_match_result(file,line_list,use_encoding)

                        # print(line_list)





def test_error_file():

    path=r'C:\git\CodePool\example-code\19-dyn-attr-prop\oscon\schedule2.py'

    with open(path,'r',encoding='utf8') as fp:

        while 1:

            x=fp.readline()

            if not x:

                break

            print(x)



def main(kw):

    app = FileSearcher(kw)

    app.run()



if __name__ == '__main__':

    fire.Fire(main)

运行： python main.py --kw=asyncio,gather

收起阅读 »

蓝灯在目录 AppData\Local\Lantern\replica 下生成的一个巨大数据文件

闲聊

在清理磁盘的过程中，发现在C的 AppData下的lantern目录下有个1G多的数据库文件。
AppData\Local\Lantern\replica
storage-cache.db
具体内容不知道是什么。
然后好奇了一下，用进程监控软件监控了一下。

发现*蓝*灯*是用golang写的。

然后后台不断地跟ask.com 进行通信，估计这个是他们托管的服务器。

后台不断地写日志，还有获取某个代理服务器的状态。

继续阅读 »

在清理磁盘的过程中，发现在C的 AppData下的lantern目录下有个1G多的数据库文件。
AppData\Local\Lantern\replica
storage-cache.db
具体内容不知道是什么。
然后好奇了一下，用进程监控软件监控了一下。

发现*蓝*灯*是用golang写的。

然后后台不断地跟ask.com 进行通信，估计这个是他们托管的服务器。

后台不断地写日志，还有获取某个代理服务器的状态。收起阅读 »

万一免五银河证券非网红营业部转债免五低佣金百万分之五

券商开户

最新更新（2022年3月19日）：
【银河万一免五又开了！难得的机会，需要开的赶紧，过了这个时间窗口就没有啦】

======================= 以前的内容 ======================================

目前市面上的银河默认不是免五的，需要找到特定的营业部才能开通。

本营业部非网红营业部，可以一加六拖拉机。以防为了套利时出不去哈。

股票费率万一免五，
可转债（新规后）也是免五，沪市费率十万分之五，深市十万分之五。

因为经常会被同行举报，所以优惠会不定期关闭，需要的朋友要抓紧时间开，开了以后即使后面银河关闭了免五的通道，后面的费率还是以你现在开的费率来计算，也是免五的。

需要的朋友可以扫描关注：备注：开户，非诚勿扰。

继续阅读 »

最新更新（2022年3月19日）：
【银河万一免五又开了！难得的机会，需要开的赶紧，过了这个时间窗口就没有啦】

======================= 以前的内容 ======================================

目前市面上的银河默认不是免五的，需要找到特定的营业部才能开通。

本营业部非网红营业部，可以一加六拖拉机。以防为了套利时出不去哈。

股票费率万一免五，
可转债（新规后）也是免五，沪市费率十万分之五，深市十万分之五。

因为经常会被同行举报，所以优惠会不定期关闭，需要的朋友要抓紧时间开，开了以后即使后面银河关闭了免五的通道，后面的费率还是以你现在开的费率来计算，也是免五的。

需要的朋友可以扫描关注：备注：开户，非诚勿扰。

收起阅读 »

绿盟下载官网被黑了？

闲聊

以前一个不错的绿色软件下载网站。
现在这样子了。

不知道是网站换人了还是被黑了？

以前一个不错的绿色软件下载网站。
现在这样子了。

不知道是网站换人了还是被黑了？

判读一个函数是不是协程

协程

传入的是函数名，不需要加入括号：

def check_coroutine(fun):

    if iscoroutinefunction(fun):

        print('是协程')

    else:

        print('不是协程')

async def visit_web():

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         'ignoreDefaultArgs':True,

         }

    )

    page = await browser.newPage()



    # 可以在launch下配置

    # await page.setViewport({

    #     "width": 1900,

    #     "height": 1020

    # })





    # 先执行下面的JS 再去goto

    await page.evaluate(

        '''() =>{ Object.defineProperties(navigator,{ webdriver:{ get: () => false } }) }''')

    # await page.screenshot({'path': 'test.png', 'fullPage': True})

    # await page.pdf({'path': 'test.pdf'})

    # await asyncio.sleep(5)



    await page.goto(url=URL)



    # 这里的js是异步的写法

    dimensions = await page.evaluate(

        '''

        ()=>{

        return {

        width:document.documentElement.clientWidth,

        height:document.documentElement.clientHeight,

        deviceScaleFactor_:window.devicePixelRatio,

        }

        }

        '''

    )



    result = await page.evaluate(

        '''

        ()=>{

        var title = document.title;

          return {title:title};

          }

          '''



    )





    await browser.close()

调用：

check_coroutine(visit_web)

注意，上面不能用visit_web()

继续阅读 »

传入的是函数名，不需要加入括号：

def check_coroutine(fun):

    if iscoroutinefunction(fun):

        print('是协程')

    else:

        print('不是协程')

async def visit_web():

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         'ignoreDefaultArgs':True,

         }

    )

    page = await browser.newPage()



    # 可以在launch下配置

    # await page.setViewport({

    #     "width": 1900,

    #     "height": 1020

    # })





    # 先执行下面的JS 再去goto

    await page.evaluate(

        '''() =>{ Object.defineProperties(navigator,{ webdriver:{ get: () => false } }) }''')

    # await page.screenshot({'path': 'test.png', 'fullPage': True})

    # await page.pdf({'path': 'test.pdf'})

    # await asyncio.sleep(5)



    await page.goto(url=URL)



    # 这里的js是异步的写法

    dimensions = await page.evaluate(

        '''

        ()=>{

        return {

        width:document.documentElement.clientWidth,

        height:document.documentElement.clientHeight,

        deviceScaleFactor_:window.devicePixelRatio,

        }

        }

        '''

    )



    result = await page.evaluate(

        '''

        ()=>{

        var title = document.title;

          return {title:title};

          }

          '''



    )





    await browser.close()

调用：

check_coroutine(visit_web)

注意，上面不能用visit_web()

收起阅读 »

可转债T+0 零手续费零费率免佣金

零费率费率可转债可转债开户可转债费率万一免五

一般而言，可转债的手续费都会比股票低

可转债新规后，佣金沪深市十万分之五
那么如果你是很抠的人，这里并不是贬义词，在菜市场，你会比较价格，而在证券市场上，为什么不挑选便宜的佣金的券商呢？

看交割单

以前看到一个案例，发现低佣是多么难得：

券商交割单只是统计到分，也就是一分钱以下是不会收取的，那么买入转债的时候，如果你的交易金额较大，那么可以使用拆单功能，就是把一个大单拆分为多个小单，如果你每个小单小于5千元，那么券商的交割费用系统就会舍弃分钱后面的金额，也就是交易费用原来是 0.003元，但只能取到分钱位置，也就是0.00，后面的3就被舍弃了，这样手续费就是为0了。

所以你要做的就是找一个可转债低佣的券商，越低越好
需要可以扫描开户：

备注：开户
非诚勿扰。

继续阅读 »

一般而言，可转债的手续费都会比股票低

可转债新规后，佣金沪深市十万分之五
那么如果你是很抠的人，这里并不是贬义词，在菜市场，你会比较价格，而在证券市场上，为什么不挑选便宜的佣金的券商呢？

看交割单

以前看到一个案例，发现低佣是多么难得：

券商交割单只是统计到分，也就是一分钱以下是不会收取的，那么买入转债的时候，如果你的交易金额较大，那么可以使用拆单功能，就是把一个大单拆分为多个小单，如果你每个小单小于5千元，那么券商的交割费用系统就会舍弃分钱后面的金额，也就是交易费用原来是 0.003元，但只能取到分钱位置，也就是0.00，后面的3就被舍弃了，这样手续费就是为0了。

所以你要做的就是找一个可转债低佣的券商，越低越好
需要可以扫描开户：

备注：开户
非诚勿扰。
收起阅读 »

pyppeteer-pdf not support latest version of pypeteer

pyppeteer

只能用0.0.25版本的pypeteer。
只好下载一个低版本的chrouium放到本地。

或者使用另一个库
https://github.com/shivanshs9/pdfgen-python

pyppeteer禁用自动化提示栏 --enable-automation参数关闭

python pyppeteer

在启动的时候加入一个参数即可：

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         # 'enable-automation':False,

         'ignoreDefaultArgs':['--enable-automation'],

         }

    )

忽略默认参数：
'ignoreDefaultArgs':['--enable-automation'],
即可，
如果需要去除更多的特征，在列表里面加入更多即可。
如果全部不要，那么就把它设置为True即可。

继续阅读 »

在启动的时候加入一个参数即可：

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000},

         # 'enable-automation':False,

         'ignoreDefaultArgs':['--enable-automation'],

         }

    )

忽略默认参数：
'ignoreDefaultArgs':['--enable-automation'],
即可，
如果需要去除更多的特征，在列表里面加入更多即可。
如果全部不要，那么就把它设置为True即可。

收起阅读 »

pyppeteer设置浏览器大小

python pyppeteer

在初始化时加入 defaultViewport字典值即可：

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000}

         }

    )

更多参数可以查看pyppeteer的源码。

        self.handleSIGINT = options.get('handleSIGINT', True)

        self.handleSIGTERM = options.get('handleSIGTERM', True)

        self.handleSIGHUP = options.get('handleSIGHUP', True)

        self.ignoreHTTPSErrors = options.get('ignoreHTTPSErrors', False)

        self.defaultViewport = options.get('defaultViewport', {'width': 800, 'height': 600})  # noqa: E501

        self.slowMo = options.get('slowMo', 0)

        self.timeout = options.get('timeout', 30000)

        self.autoClose = options.get('autoClose', True)

继续阅读 »

在初始化时加入 defaultViewport字典值即可：

    browser = await pyppeteer.launch(

        {'headless': False,

         'userDataDir': UserDataDir,

         'defaultViewport': {'width': 1800, 'height': 1000}

         }

    )

更多参数可以查看pyppeteer的源码。

        self.handleSIGINT = options.get('handleSIGINT', True)

        self.handleSIGTERM = options.get('handleSIGTERM', True)

        self.handleSIGHUP = options.get('handleSIGHUP', True)

        self.ignoreHTTPSErrors = options.get('ignoreHTTPSErrors', False)

        self.defaultViewport = options.get('defaultViewport', {'width': 800, 'height': 600})  # noqa: E501

        self.slowMo = options.get('slowMo', 0)

        self.timeout = options.get('timeout', 30000)

        self.autoClose = options.get('autoClose', True)

收起阅读 »

python判断可转债是否强赎

量化交易可转债

占坑，后期把代码整理下放上来。

更新：

制作好了一个接口，用户可以直接调用。
数据来源与集思录。

获取 排除满足强赎天数剩余N天的可转债，排除强赎可转债。



比如：DAY=4 ，那么假设强赎满足天数为15天，那么返回市场上强赎强赎倒数天数大于4天的可转债，即返回小于或者等于11天以下的转债。把满足条件还差4天的转债排除掉了，当然，已经公告强赎的也会被排除。







import requests



URL = 'http://11.11.11.11/api/redeem/'

# DAY 强赎倒数剩余天数小于 DAY （4）天， 已经公告强赎的也是被排除的

DAY = 4



SIGN = '私信星主获取' # sign和以前一致



data = {'day': DAY,

        'sign': SIGN}

r = requests.post(URL, data=data)



print(r.json())

具体用户可以关注知识星球：

继续阅读 »

占坑，后期把代码整理下放上来。

更新：

制作好了一个接口，用户可以直接调用。
数据来源与集思录。

获取 排除满足强赎天数剩余N天的可转债，排除强赎可转债。



比如：DAY=4 ，那么假设强赎满足天数为15天，那么返回市场上强赎强赎倒数天数大于4天的可转债，即返回小于或者等于11天以下的转债。把满足条件还差4天的转债排除掉了，当然，已经公告强赎的也会被排除。







import requests



URL = 'http://11.11.11.11/api/redeem/'

# DAY 强赎倒数剩余天数小于 DAY （4）天， 已经公告强赎的也是被排除的

DAY = 4



SIGN = '私信星主获取' # sign和以前一致



data = {'day': DAY,

        'sign': SIGN}

r = requests.post(URL, data=data)



print(r.json())

具体用户可以关注知识星球：

收起阅读 »

可转债开户免五

可转债费率券商开户券商股票

可转债的开户条件：
1. 和股票证券一样，需要开通一个证券账户，年满18周岁即可。

2. 开通券商账户后，需要在券商软件的业务里面，选择开通可转债交易权限，会让你做十道题，题目比较简单，做错了也可以重来的。

3. 然后就可以交易可转债了。可转债是T+0的，也就是可以当天来回买卖。

可转债新规，费率如下

沪市十万分之五，深市十万分之五，而且是免5，没有最低消费，

如果有需要，可以扫描下方二维码开户吧：
请注明开户，不然非诚勿扰：

继续阅读 »

可转债的开户条件：
1. 和股票证券一样，需要开通一个证券账户，年满18周岁即可。

2. 开通券商账户后，需要在券商软件的业务里面，选择开通可转债交易权限，会让你做十道题，题目比较简单，做错了也可以重来的。

3. 然后就可以交易可转债了。可转债是T+0的，也就是可以当天来回买卖。

可转债新规，费率如下

沪市十万分之五，深市十万分之五，而且是免5，没有最低消费，

如果有需要，可以扫描下方二维码开户吧：
请注明开户，不然非诚勿扰：

收起阅读 »

可转债市场最低费率是多少

可转债费率可转债开户券商开户券商股票

最近不少过来开户的人，都是因为之前很早前开的券商户，比如像华泰这种，在4,5年前开的。
有些人也不怎么看交割单，不看不知道，一看吓一跳。

交易最低1元，也就是如果买1手转债（10张），共1000元，或者中签了，中了一手可转债，也就是1000元，卖出最低给1元。
而费率就是千分之一，也就是交易1万元，要给10元的交易费率。

本身可转债是T+0了，每天可以来回做T，沪市转债（新规）费率是十万分之5，是深市的稍微贵一些，十万分之5

具体费率：

如果需要开户的可以扫描以下二维码，保证费率市场最低

备注开户。

PS：本人不是券商人员。如果你需要开通其他券商，也可以找我开，我这里有大部分券商的开户资源，也清楚每个品种的费率情况，也希望推荐一个适合的券商给你，免得被手续费吸走你的盈利哈。

继续阅读 »

最近不少过来开户的人，都是因为之前很早前开的券商户，比如像华泰这种，在4,5年前开的。
有些人也不怎么看交割单，不看不知道，一看吓一跳。

交易最低1元，也就是如果买1手转债（10张），共1000元，或者中签了，中了一手可转债，也就是1000元，卖出最低给1元。
而费率就是千分之一，也就是交易1万元，要给10元的交易费率。

本身可转债是T+0了，每天可以来回做T，沪市转债（新规）费率是十万分之5，是深市的稍微贵一些，十万分之5

具体费率：

如果需要开户的可以扫描以下二维码，保证费率市场最低

备注开户。

PS：本人不是券商人员。如果你需要开通其他券商，也可以找我开，我这里有大部分券商的开户资源，也清楚每个品种的费率情况，也希望推荐一个适合的券商给你，免得被手续费吸走你的盈利哈。收起阅读 »

pyppeteer下载chromedriver失败的解决办法

pyppeteer

因为网址变了！

urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='storage.googleapis.com', port=443): Max retries exceeded with url: /chromium-browser-snapshots/Win_

x64/588429/chrome-win32.zip (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x00000000037D3880>: Failed to establish a new connect

ion: [Errno 11004] getaddrinfo failed'))

用浏览器看了，发现根本打不开。
然后谷歌了一下它的镜像，实际链接为：
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/575458/chrome-win32.zip

所以，哎，这个库真的有点烂。
直接下载上面的链接，然后解压到本地路径，然后在设置一个环境变量指向这个目录即可。

继续阅读 »

因为网址变了！

urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='storage.googleapis.com', port=443): Max retries exceeded with url: /chromium-browser-snapshots/Win_

x64/588429/chrome-win32.zip (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x00000000037D3880>: Failed to establish a new connect

ion: [Errno 11004] getaddrinfo failed'))

用浏览器看了，发现根本打不开。
然后谷歌了一下它的镜像，实际链接为：
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/575458/chrome-win32.zip

所以，哎，这个库真的有点烂。
直接下载上面的链接，然后解压到本地路径，然后在设置一个环境变量指向这个目录即可。
收起阅读 »

转换很多逗号的,,,,,,,,, JS的数组为python列表

python

不知道JS的写法就是这样还是这样的，一个列表可以这么写
var arr = [,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,2,3,4,5] 前面的逗号就是没有数据，None或者0.
然后JS的代码可以不填充任何数据。python要把它转为list，要怎么做的？

有2个方法：

1. 最简单，因为，，的意思是0,0，那么我们可以把两个逗号替换成0,0，
但是如果前面的逗号数是单数，比如是3个逗号，
arr=[,,,1,2,3]
直接替换2个逗号为0,0，的话，结果是0,0,，1,2,3
结果也不对。
多了一对逗号
然后可以直接再替换一次，，把两个的地方替换为1个，

2. 使用finditer找出每个多余2个逗号的起始和结束，然后替换为0，即可。
for m in re.finditer(',{2,}'):
start=m.start()
end=m.end()

继续阅读 »

不知道JS的写法就是这样还是这样的，一个列表可以这么写
var arr = [,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,2,3,4,5] 前面的逗号就是没有数据，None或者0.
然后JS的代码可以不填充任何数据。python要把它转为list，要怎么做的？

有2个方法：

1. 最简单，因为，，的意思是0,0，那么我们可以把两个逗号替换成0,0，
但是如果前面的逗号数是单数，比如是3个逗号，
arr=[,,,1,2,3]
直接替换2个逗号为0,0，的话，结果是0,0,，1,2,3
结果也不对。
多了一对逗号
然后可以直接再替换一次，，把两个的地方替换为1个，

2. 使用finditer找出每个多余2个逗号的起始和结束，然后替换为0，即可。
for m in re.finditer(',{2,}'):
start=m.start()
end=m.end()
收起阅读 »

imgtu的设计有毛病吧？垃圾路过图床

闲聊

这个站点是不允许别人用梯子上传图片。

然后自己官方的联系方式里面放一个电报telegram的链接。

还有那个发送后台消息给官方邮件的验证码，也是一个谷歌的验证码，没有梯子哪有能耐发消息给你呀？

反正就是莫名其妙的被封禁了。导致个人存放在上面的图片变成了死链接，主要要回去硬盘里面一张张图片找回来，补回去原来的博客文章里面，够呛的了。

这个垃圾网站就是一个坑逼，谁用谁傻逼！

还是老老实实用阿里云或者腾讯，七牛的空间，访问量不高的费用又不高。
主要是被人坑的感觉不爽。

免费图床虽然可以不花钱，但我悲观地认为，大多免费且赚不了钱的服务终究走不了长远，也许未来的某一天，你就会突然收到「XX 关停」的通知。

继续阅读 »

这个站点是不允许别人用梯子上传图片。

然后自己官方的联系方式里面放一个电报telegram的链接。

还有那个发送后台消息给官方邮件的验证码，也是一个谷歌的验证码，没有梯子哪有能耐发消息给你呀？

反正就是莫名其妙的被封禁了。导致个人存放在上面的图片变成了死链接，主要要回去硬盘里面一张张图片找回来，补回去原来的博客文章里面，够呛的了。

这个垃圾网站就是一个坑逼，谁用谁傻逼！

还是老老实实用阿里云或者腾讯，七牛的空间，访问量不高的费用又不高。
主要是被人坑的感觉不爽。

免费图床虽然可以不花钱，但我悲观地认为，大多免费且赚不了钱的服务终究走不了长远，也许未来的某一天，你就会突然收到「XX 关停」的通知。收起阅读 »

pyppeteer 在AppData下的dev_profile 生成大量文件

哪些证券开户可以免5

pip install peewee ： AttributeError: 'str' object has no attribute 'decode'

招商证券可以办万一免5吗

特斯拉水军还挺多的还是友商的高级黑呢

python 破解谷歌人机验证码运用百度语音识别

百度AI的语音识别无法识别到英文原因

百度英语中文语音识别为文字服务 python demo【使用requests重写官方demo】

银河证券拖拉机如何开通一拖六一拖七

川财证券费率股票万一，转债百万分之二费率最低开户

基金常见误区

直接买入红利增强与易基综债【2021-04-22】

pymongo update_one/update_many 返回更新数据的数目

南方聚利160131 开放申购 2021年5月14日

轻报APP --骗子请注意点

本地代码搜索脚本 python实现

蓝灯在目录 AppData\Local\Lantern\replica 下生成的一个巨大数据文件

万一免五银河证券非网红营业部转债免五低佣金百万分之五

绿盟下载官网被黑了？

判读一个函数是不是协程

可转债T+0 零手续费零费率免佣金

pyppeteer-pdf not support latest version of pypeteer

pyppeteer禁用自动化提示栏 --enable-automation参数关闭

pyppeteer设置浏览器大小

python判断可转债是否强赎

可转债开户免五

可转债市场最低费率是多少

pyppeteer下载chromedriver失败的解决办法

转换很多逗号的,,,,,,,,, JS的数组为python列表

imgtu的设计有毛病吧？垃圾路过图床

热门文章

热门话题