Python反解js加密的邮件地址
近日,在爬取某站的资料时,发现抓取到的资料中所包含的邮箱地址都被网站的度娘云加速通过js加密了,而用浏览器查看网页是能够看到邮箱地址,如图:
看源码就显示加密了,下图中data-cfemail="xxxxx"里面的就是加密后的邮箱地址,如图:
经过科学上网,终于找到解密方法,代码如下:
1 2 3 4 5 6 |
def decodeEmail(e): de = "" k = int(e[:2], 16) for i in range(2, len(e)-1, 2): de += chr(int(e[i:i+2], 16)^k) return de |