日期:2014-05-17  浏览次数:20924 次

求助如何通过本地htm文件提取出相应数据?


如图片,我想提取每题的题目、A、B、C、D 答案和正确答案的数据以便写入数据库。

由于数据特别多,所以不想一个个的复制到数据库。求高手指点。

下面是其中一题的HTML代码
HTML code

<p><b><span>一、单项选择题( 本类题共<span>20</span>题,每题<span>1</span>分,共<span>20</span>分。)<span><o:p></o:p></span></span></b></p>

<p><a><span>1</span></a><span><span>、税收<span>“</span>三性<span>”</span>的核心是( )。</span></span><span><o:p></o:p></span></p>

<p><span>A</span><span>、无偿性<span><o:p></o:p></span></span></p>

<p><span>B</span><span>、固定性<span><o:p></o:p></span></span></p>

<p><span>C</span><span>、收益性<span><o:p></o:p></span></span></p>

<p><span>D</span><span>、强制性<span><o:p></o:p></span></span></p>

<p><span>正确答案:<span>A</span></span><span><span><o:p></o:p></span></span></p>

<p><b><span>解析:</span></b><span>本题考核税收的特征。税收的无偿性至关重要,体现了财政分配的本质,它是税收<span>“</span>三性<span>”</span>的核心。<span><o:p></o:p></span></span></p>


------解决方案--------------------
找可以解析htm的组件,或者用正则解析