版块 > WinDev 讨论区 > 打印html源码的问题
消息:
2
HTML转换为文本 直接就将所有标签去掉了。测试过rtf输出也一样,或者就输出了乱码。

打算用windev做个简单的网页采集器,需要抓取网页源代码后分析提取相应的内容,其他编程工具一般有正则、xpath 2种方法。
查看文档只看到 对xml支持xpath,不清楚对html代码是否支持,还有就是html如何完整的显示到文本框里面,html中文编码乱码如何解决的?

还请管理员帮忙解答。
    统计
    注册会员总数: 379
    论坛帖子总数: 1049