授权公布号:CN103744987B
基于DOM树匹配的视频网站媒资聚合方法和系统
有效
申请
2014-01-20
申请公布
2014-04-23
授权
2017-01-11
预估到期
2034-01-20
| 申请号 | CN201410026230.5 |
| 申请日 | 2014-01-20 |
| 申请公布号 | CN103744987A |
| 申请公布日 | 2014-04-23 |
| 授权公布号 | CN103744987B |
| 授权公告日 | 2017-01-11 |
| 分类号 | G06F17/30 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 深圳市佳创视讯技术股份有限公司 |
| 申请人地址 | 广东省深圳市福田区滨河路以南、沙嘴路以东中央西谷大厦,15层01-08,16层04-06 |
专利法律状态
2017-01-11
授权
状态信息
授权
2014-05-21
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F17/30;申请日:20140120
2014-04-23
公布
状态信息
公布
摘要
本发明公开了一种基于DOM树匹配的视频网站媒资聚合方法和系统,所述方法包括S1)生成配置文件:根据用户的输入生成配置文件,所述配置文件的结构包括基本信息单元、媒资参数单元和DOM子树结构单元;S2)获取HTML文档并生成HTML文档的DOM树:向待聚合的网站请求并获取HTML文档,解析所述HTML文档生成HTML文档的DOM树;S3)媒资信息提取:导入所述匹配模板并生成模板DOM树;对所述HTML文档的DOM树与所述DOM模板树进行模板匹配,从所述HTML文档的DOM树中提取出满足所述最简结构的子节点,然后提取出该子节点中所包含的媒资信息。与现有技术相比,本发明具有更优的兼容性及稳定性。


