利用python怎么爬取抖音的评论数据
导读:本文共4215字符,通常情况下阅读需要14分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要: 安装需要的工具:python3 下载fiddle 安装及配置手机模拟器下载抖音部分:模拟器下载好之后, 打开模拟器在应用市场下载抖音对抖音进行fiddle配置,配置成功后就可以当手机一样使用了一、工具配置及抓包:我们随便打开一个视频之后,fiddle就会刷新新的数据包在json中找到视频地址:二、fiddler中添加下载视频评论代码在fiddler中添加下载视频... ...
目录
(为您整理了一些要点),点击可以直达。安装需要的工具:
python3 下载
fiddle 安装及配置
手机模拟器下载
抖音部分:
模拟器下载好之后, 打开模拟器
在应用市场下载抖音
对抖音进行fiddle配置,配置成功后就可以当手机一样使用了
一、工具配置及抓包:
我们随便打开一个视频之后,fiddle就会刷新新的数据包
在json中找到视频地址:
二、fiddler中添加下载视频评论代码
在fiddler中添加下载视频代码:注意两点:
(1)get后面的路径要随时看进行更换
(2)下载的路径要在fiddler下面自己新建
if(m_Hide304s&&oSession.responseCode==304){oSession["ui-hide"]="true";}if(oSession.uriContains("https://aweme.snssdk.com/aweme/v1/general/search/single/")){varstrBody=oSession.GetResponseBodyAsString();varsps=oSession.PathAndQuery.slice(-58,);//FiddlerObject.alert(sps)vartimestamp=newDate().getTime();varfilename="D:\抖音评论资料"+"/"+sps+timestamp+".json";varcurDate=newDate();varsw:System.IO.StreamWriter;if(System.IO.File.Exists(filename)){sw=System.IO.File.AppendText(filename);sw.Write(strBody);}else{sw=System.IO.File.CreateText(filename);sw.Write(strBody);}sw.Close();sw.Dispose();
此段代码放到fiddler中的script的response中,如下图:添加好之后别忘记保存!!
三、python执行代码pycharm新建py文件
程序执行代码:
importosimportjsonimporttimeimportrequestsimportreimportcsvclassDouyin(object):def__init__(self):passself.url1='https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885929189950737676&cursor=0&count=20&address_book_access=1&gps_access=1&forward_page_type=1&channel_id=0&city=310000&hotsoon_filtered_count=0&hotsoon_has_more=0&follower_count=0&is_familiar=0&page_source=0&os_api=25&device_type=VOG-AL00&ssmix=a&manifest_version_code=110301&dpi=240&uuid=868594157367551&app_name=aweme&version_name=11.3.0&ts=1603350069&cpu_support64=false&app_type=normal&ac=wifi&host_abi=armeabi-v7a&channel=aweGW&update_version_code=11309900&_rticket=1603350070959&device_platform=android&iid=1758845207590062&version_code=110300&mac_address=b0%3Ac4%3A2d%3Ad0%3Aed%3A38&cdid=7974198e-c4c0-49c2-bfaa-43686052706e&openudid=d0c6cffa7067bedd&device_id=844047245117672&resolution=720*1280&device_brand=HUAWEI&language=zh&os_version=7.1.2&aid=1128&mcc_mnc=46000'self.url2='https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885163969477086479&cursor=0&count=20'self.header={'Accept-Encoding':'gzip','X-SS-REQ-TICKET':'1603350070957','sdk-version':'1','Cookie':'install_id=1758845207590062;ttreq=1$34f012b99d70a66f681dc3d1f0b438fc1b161af3;d_ticket=77247c94236bf8055c233f8cabb6a5ddf3231;odin_tt=fccb20add45a15f08a2519eadcaaf22cba4b3f8f1fceec300a088407c2daf81ea76b260ef6c81dbc86dfedfea011f68c25238f9b3984fe4f5909441dfd1cc9c2;sid_guard=6de18a966e69dcbbf076f629a2ef6511%7C1603345424%7C5184000%7CMon%2C+21-Dec-2020+05%3A43%3A44+GMT;uid_tt=ba98af780b4e337f01463cf98a8afafd;sid_tt=6de18a966e69dcbbf076f629a2ef6511;sessionid=6de18a966e69dcbbf076f629a2ef6511','x-tt-token':'006de18a966e69dcbbf076f629a2ef651189d3f6f73fd3d6319b543d50d2e2e5a4cf3e383f8da81f07e049bcf850de07d331','X-Gorgon':'0404d8210000a6a3dca0dbc6b11483a82420c9a94dd050a3e511','X-Khronos':'1603350070','Host':'aweme.nssdk.com','Connection':'Keep-Alive','User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/86.0.4240.75Safari/537.36',}self.add='D:\抖音评论资料'self.videos_list=os.listdir('D:\抖音评论资料')defparse(self):'链接,内容,发布人昵称,发布时间,点赞数,评论数,分享数'lists=[]forvidinself.videos_list:a=open('D:\抖音评论资料\{}'.format(vid),encoding='utf-8')content=json.load(a)forconincontent['data']:meta={}try:meta['title']=con['aweme_info']['desc']meta['author_name']=con['aweme_info']['author']['nickname']meta['u_name']=con['aweme_info']['author']['unique_id']meta['create_time']=con['aweme_info']['create_time']timeArray=time.localtime(meta['create_time'])meta['create_time']=time.strftime("%Y--%m--%d%H:%M:%S",timeArray)meta['digg_count']=con['aweme_info']['statistics']['digg_count']meta['comment_count']=con['aweme_info']['statistics']['comment_count']meta['share_count']=con['aweme_info']['statistics']['share_count']meta['share_url']=con['aweme_info']['share_url']except:meta['title']=''meta['author_name']=''meta['u_name']=''meta['create_time']=''meta['digg_count']=''meta['comment_count']=''meta['share_count']=''meta['share_url']=''ifmeta['u_name']=='':try:meta['u_name']=con['aweme_info']['music']['owner_handle']except:meta['u_name']=''ifmeta['title']=='':passelse:lists.append(meta)#print(meta)returnlistsdefsave_data(self,meta):header=['share_url','title','author_name','u_name','create_time','digg_count','comment_count','share_count']print(meta)withopen('test.csv','a',newline='',encoding='utf-8-sig')asf:writer=csv.DictWriter(f,fieldnames=header)writer.writeheader()#写入列名writer.writerows(meta)defrun(self):meta=self.parse()self.save_data(meta)if__name__=='__main__':douyin=Douyin()douyin.run()
运行代码后在代码执行目录下会生成一个excel
ps:抖音不会一次性返回整个评论数据包,每次往下滑动评论区会多出26条评论数据,我们就可以利用模拟器进行滑动操作。
点击 更多>鼠标宏
点击录屏之后,用鼠标往下滑动一次页面
点击停止,就会将你刚才的操作保存下来
点击设置 可以对刚才的操作进行循环播放,从而达到自动刷新评论区。
</div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">
利用python怎么爬取抖音的评论数据的详细内容,希望对您有所帮助,信息来源于网络。