929?1442652660

【缺陷】 lupaworld的bbs抽取问题逻辑有问题,应该只保存主贴内容 正常


甘谊昂添加于 2014-08-13 11:21
回复也内容根据@Song 观察结果,不需要抽取。 主贴是指hthread-[0-9]+-1-1.html 注意1-1。 之前爬取,把回复内容也给爬下来了。
回复(3)
  • 241?1445561792
    张方 10年前

    > gyiang 写到: > 回复也内容根据@Song 观察结果,不需要抽取。 > 主贴是指hthread-[0-9]+-1-1.html 注意1-1。 > 之前爬取,把回复内容也给爬下来了。 经分析发现主帖并不是thread-[0-9]+-1-1.html ,而是thread-[0-9]+-1-[0-9]+.html .

  • 241?1445561792
    张方 10年前

    状态正在解决 变更为 已解决

    % 完成20 变更为 100

    已解决,数据正在重新爬取中。

  • 241?1445561792
    张方 10年前

    状态新增 变更为 正在解决

    % 完成0 变更为 20

    正在进行修改。

0?1470885445
登录后可添加回复
  • 当前状态 已解决
  • 选定优先级 正常
  • 指派给 张方
  • 里程碑 --
  • 开始日期 2014-08-13
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 100%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×