我之前在大学学习Java有一个为期3个月的短期课程(唯一的项目是编写数独游戏) .
我想学习一种最常用于一般自动化任务的编程语言 . 到目前为止,我已经选择了AHK,它帮助我提供了大量的文本扩展/应用程序快捷方式等等 .
想进一步推进并完成以下工作,例如:
1访问本网站:https://carousell.com/search/products/?query=12-35mm
2刮掉包含“Panasonic”,“12-35mm”的所有数据(难以刮掉这些结果的每一页吗?)
3价格列的价格 . 如果价格具有误导性(例如$ 1或低于$ 4 4的 Value ),则在商品描述中搜索价格值(“$”) .
4 Tabluate结果在Excel中
5将最新结果与平均价格进行比较 .
6如果最新价格低于平均价格>通过电子邮件提醒我 .
我的大多数自动化项目都是这样的 . 什么是最好的编程语言,哪些付费教程可以指导我做到这一点?
我把它缩小到Import.IO和Python;但我可能错了 .
这个课程看起来很有用,但我不确定它是否能教会我完成这个个人项目所需的一切 .
https://www.udemy.com/automate/
请指教,谢谢!
1 回答
Python非常适合这些类型的Web抓取和处理 . 您的工作需要几个模块:
通过HTTP(S)获取页面:由于您要抓取的页面不使用Javascript输出您需要的信息,我建议好的requests就足够了 .
解析HTML并提取信息:这里有很多选择,我个人最喜欢的是BeautifulSoup . 如果你想深入挖掘,有一个question about this .
将结果保存到Excel:几个模块将再次完成工作,我最喜欢的是openpyxl . 如果您不需要保存非常大的文件,这应该没问题 .
价格比较:您可以仅将价格与脚本进行比较,将Excel工作表作为“数据库”进行比较 .
通过电子邮件发送:您可以使用Python standard library发送电子邮件 . 这是fine tutorial如何做到这一点..
没有尝试编写脚本,如果您需要任何特定阶段的提示,请返回特定代码,该代码不适用于该特定部分,然后我们可以帮助您 .