查看: 2833|回复: 5

【原创】筛选论坛特定版面下某人所发主题的CMD脚本

[复制链接]
发表于 2008-3-25 17:05:43 | 显示全部楼层 |阅读模式
论坛有搜索功能,但有时不符合俺的要求,俺可能只想查看某版面下某个人所发的全部主题,不想看其他版面,那么论坛就没这个功能了,也可能是俺的权限不够,所以,只好自力更生,祭出CMD大法,呵呵。

       下面以“添加剂”版面dazhui先生所发主题为例,说说俺的过程,希望dazhui先生理解并见谅

步骤:
1. 利用curl取得html文本源码,嘿嘿,curl真是好东西,善加利用,好处多多,怎么使用?哪儿下载?网上呗,俺就不多说了。
  1. @echo off
  2. setlocal ENABLEDELAYEDEXPANSION
  3. for /l %%i in (1,1,21) do (
  4. set num=%%i
  5. curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -o tmp%%i.txt http://www.xumuren.com/forum-673-!num!.html
  6. )
  7. copy tmp*.txt temp.txt
  8. del tmp*.txt
  9. endlocal
复制代码
2. 分析文本,判断发帖主题特点过滤文本
       CMD下,执行:
  1. findstr "uid=21848 thread_" temp.txt >temp1.txt
复制代码
3. 再过滤文本提取主题和链接
  1. @echo off
  2. setlocal ENABLEDELAYEDEXPANSION
  3. for /f "tokens=* delims=" %%a in (temp1.txt) do (
  4. set strchr=%%a
  5. for /f "tokens=2 delims=<" %%i in ("!strchr!") do (
  6. set spanchr=%%i
  7. set spanchr=!spanchr:~0,4!
  8. if !spanchr!==span (
  9. set uidstr=!strchr!
  10. )
  11. )
  12. for /f "tokens=2 delims=;" %%i in ("!strchr!") do (
  13. set uid=%%i
  14. set uid=!uid:~4,5!
  15. if !uid!==21848 (
  16. for /f "tokens=2-3 delims=>" %%m in ("!uidstr!") do (
  17. set threadstr=%%m
  18. set threadstr=!threadstr:~9,22!
  19. set threadchn=%%n
  20. set threadchn=!threadchn:~,-3!
  21. )
  22. echo http://www.xumuren.com/!threadstr!,!threadchn! >>dazhui.txt
  23. )
  24. )
  25. )
  26. endlocal
  27. del temp1.txt >nul
  28. start dazhui.txt
复制代码
最终结果:

生理调控方法
关于微量元素络合物一个小问题
饲料添加剂揭秘------抗氧化剂
关于酸化剂的一些看法
紫外分光光度法测定吉他霉素的含量
寻求帮助
粗算大蒜素的价格(不对别攻击我)
关于饲料用酶制剂
感谢大家支持
饲料添加剂揭秘——大蒜素
一个适合于先试用的促生长添加剂
断奶仔猪饲粮中添加“卫肠康”替代高剂量氧化锌的效果试验
关于复合酶的选择之一——酶的“记忆性”
倍壮素的实验报告
对使用添加剂的一些看法 bqs
我早上看见的一篇论文----一个国家自然基金项目
饲料添加剂揭秘------甜味剂
我对饲料添加剂揭秘不是因为悲观
我其实是一个"伪"技术员而已
富马酸单酯防霉的肤浅研究(部分)
请问这里做添加剂业务的有吗
促生长产品到底促进多少客户容易接受
饲料厂怎么来用添加剂
我还是不说了为好
我对揭秘的自我反思
大蒜素方面的资料
关于中国目前饲料添加剂的应用现状与实情 bqs
关于发酵豆粕(或其他)的一些看法
动物的油脂问题.
抗氧化剂的评价
请问有做饲料添加剂业务的QQ群吗
饲料添加剂揭秘------防霉剂
饲料添加剂揭秘——吉它霉素
这个是怎么回事啊?
我所知道的一些国家标准的来历
有朋友问一些甜味剂方面的问题]我简单说一下自己的理解
饲料添加剂揭秘——保质期

近来正练习使用Windows脚本,在这方面,俺只是初学者,见笑。




[ 本帖最后由 smith 于 2008-3-28 00:13 编辑 ]
中国畜牧人网站微信公众号
版权声明:本文内容来源互联网,仅供畜牧人网友学习,文章及图片版权归原作者所有,如果有侵犯到您的权利,请及时联系我们删除(010-82893169-805)。
 楼主| 发表于 2008-3-25 17:13:08 | 显示全部楼层
说明一下,第1、第3段代码拷贝成CMD文件,第2段在CMD下执行即可,所有操作完,可删除temp.txt、temp1.txt,双击打开dazhui.txt即可
 楼主| 发表于 2008-3-28 00:17:22 | 显示全部楼层
到底怎么回事?俺25号发完帖子看的时候是正常的,今天上来一看,帖子内容不正常了,有很多html代码而不是discuz代码,为了对俺发出的帖子负责,害得俺花了不少时间编辑修改 :'(:: :'(::
 楼主| 发表于 2008-3-28 00:25:48 | 显示全部楼层
说明一下,上面那段代码可以根据情况进行修改,比如,如果想就某个“关键词”主题来搜索某版面,那么,通过修改第2步过滤出主题,第3步找出链接即可。
发表于 2008-3-28 17:23:23 | 显示全部楼层
楼主是电脑通啊,我好像用不了。
 楼主| 发表于 2008-3-28 18:33:23 | 显示全部楼层
电脑通倒不至于,只是使用时间比较长罢了,某些方面稍微熟悉些。俺不敢说、也从来不认为俺是高手,俺碰到的高手太多了,与他们在一起,心里那个汗啊。
怎么用不了?不应该的,除了curl这个程序,其他就是批处理脚本或命令啊。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

发布主题 快速回复 返回列表 联系我们

关于社区|广告合作|联系我们|帮助中心|小黑屋|手机版| 京公网安备 11010802025824号

北京宏牧伟业网络科技有限公司 版权所有(京ICP备11016518号-1

Powered by Discuz! X3.4  © 2001-2021 Comsenz Inc. GMT+8, 2024-5-26 02:32, 技术支持:温州诸葛云网络科技有限公司