我正在开发一个Java项目,它从URL源读取RSS,解析日期, Headers 和描述,并将其转换为JSON文件,在电视屏幕上显示为HTML5页面 .

所以步骤是:管理员发布RSS源的来源,如:

http://g1.globo.com/dynamo/pr/parana/rss2.xml http://noticias.r7.com/economia/feed.xml http://feeds.feedburner.com/Rss-Presidencia-Agenda ?fmt = xml http://rss.cnn.com/rss/edition_world.rss

......或任何其他 .

使用Java Rome框架,我将URL的内容转换为JSON文件,并将其发送到HTML5 / Javascript页面(通过套接字,而不是点),在程式化页面上显示它 .

我可以获取日期, Headers 和描述,因为它们是包含默认标签的字段,但我也希望获得新闻的图像 .

问题是:有时,根据提要源,图像位于“image / url”标记中(如第一个链接示例),有时它在“内容”或“描述”标记中作为HTML代码,并且有时候在任何其他地方 . 有时,图像只是缩略图,或者只是子弹 .

因此,我无法按要求显示新闻图像 . 有没有办法以标准化的方式做到这一点,无论新闻来源如何?