注册

结构化数据_其他_通用问答—XML格式及规范说明:

标签名称 标签说明 标签类型 标签限制 可选/必选 举例
urlset urlset用来标记整个文档的开头 // 必选
url url标记每条信息的开始和结束 // 可选
最多出现50000次
loc 问答页面的url链接 任意URL最小长度1个字符
最大长度256个字符
符合正则表达式(http://)(.+)
必选
lastmod 指该条数据的最新一次更新时间 日期或日期时间格式为:YYYY-MM-DD[Thh:mm:ss],日期与时间之间使用T分隔,可以仅提供年月日部分 可选 2013-01-01
changefreq 指该条数据的更新频率 字符串有效值为:always、hourly、daily、weekly、monthly、yearly、never 可选 always
priority 用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间 小数大于等于0.0
小于等于1.0
可选 1.0
data // 必选
display // 必选
breadcrumb 该问题所属的类别;不同种类的问答页,类别体系划分不同。各网站可按照自己的分类体系提供到最细一级的分类 字符串 可选 生活>保健养生
title 问题的标题 字符串 必选 如何减少电脑辐射
link 问答页面的URL链接 字符串 必选
status 问题的状态,是否已解决等 字符串 可选 已解决
content 问题的正文,部分问答标题即已完成问题,而正文为空。 字符串 可选 如何减少电脑辐射,请教各位
questioner 问题帖子的创建人 // 必选
post_time 问题提出的时间 日期时间格式为:YYYY-MM-DDThh:mm:ss,日期与时间之间使用T分隔 必选 2011-09-24T19:37:00
has_reply 针对此问题给出的回答 // 可选
不限制最多出现次数
reply_count 针对此问答帖的回答帖子的总数量 整数 可选 2
view_count 此问答帖被浏览的次数 字符串 可选 100
collect_count 此问题被收藏/关注的数量 整数大于等于0 可选 30
share_count 此问题被分享的次数 整数大于等于0 可选 25
keywords 此问答帖子中的关键标签 字符串 可选
不限制最多出现次数
养生
questioner
accountName 提问者的用户名,或者是真实姓名(实名问答社区) 字符串 必选 匿名
gender 提问者性别 字符串 可选
age 提问者年龄 整数 可选 29
location 提问者所在的地区 字符串 可选 北京
status 提问者提问时的状态 字符串 可选
不限制最多出现次数
还没有宝宝
has_reply
content 回答的主体内容 字符串 必选 "1、在电脑旁放上几盆仙人掌,它可以有效地吸收辐射; 2、每天上午喝2至3杯的绿茶,吃一个橘子。"
status "1. 填写内容:“最佳答案”或“推荐答案”或“其他答案” 2. 解释: 1)最佳答案:由提问者评选出的最优答案; 2)推荐答案:提问已结束,但提问者没有选择最佳答案,通过编辑选择等其他方式挑出的最优答案; 3)其他答案:既不是最佳答案也不是推荐答案的答案。 " 字符串 必选 最佳答案
replier 回答帖子的创建者 // 必选
reply_time 创建回答帖子的时间 日期时间格式为:YYYY-MM-DDThh:mm:ss,日期与时间之间使用T分隔 必选 2012-02-05T12:24:00
comment 其他用户对此回答的评论,包括3部分 // 可选
不限制最多出现次数
evaluation 提问者对此回答的评价 字符串 可选 thanks a lot!
additional_question 追问的问题内容 字符串 可选
不限制最多出现次数
additional_reply 追问问题的回答内容 字符串 可选
不限制最多出现次数
like_count 得到赞的总数量 整数 可选 55
dislike_count 得到不赞同的总数量 整数大于等于0 可选 0
share_count 回答帖子被分享的总数量 整数大于等于0 可选 8
replier
accountName 回答者的用户名或者真实姓名/称呼(实名社区) 字符串 必选 周联生
career 如果回答者是隶属于某专业机构的专业人士,需提供回答者的职业,主要针对健康类、法律类 字符串 可选 健康类
job_title 如果回答者是隶属于某专业机构的专业人士,需提供回答者的职位,主要针对健康类、法律类 字符串 可选 主任医师
link 回答者的个人页面链接 任意URL 可选
image 回答者的照片 任意URL 可选
不限制最多出现次数
work_for "回答者可能是律师、医生、地产经纪等专业人士,需提供其所在的律所、医院/科室、中介机构等所属单位的名称 如果是医生,需标明所在医院和科室,格式为“医院/科室”" 字符串 可选
不限制最多出现次数
徐州市第一人民医院 神经内科
grade 回答者在问答社区的等级 字符串 可选 二级
question_count 在问答社区提问的总数量 整数 可选 2
answer_count 在问答社区回答问题的总数量 整数 可选 26
acceptance_rate 在问答社区回答问题的被采纳率 字符串 可选 46%
like_count 在问答社区回答问题的被赞数量 整数 可选 8
collect_count 在问答社区回答问题的被收藏数量 整数 可选 4
comment
creator 评论者的用户名 字符串 可选 zhu13780
commentText 评论的正文内容 字符串 可选 不对不对不对好多都是错的
commentTime 日期时间格式为:YYYY-MM-DDThh:mm:ss,日期与时间之间使用T分隔 可选 2013-05-04T11:04:00

XML格式举例

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<!-- urlset,urlset用来标记整个文档的开头,最少出现1次 最多出现1次 -->
    <url>
    <!-- url,url标记每条信息的开始和结束,最少出现0次 最多出现50000次 -->
        <loc><![CDATA[http://zhidao.baidu.com/question/374362763.html]]></loc>
        <!-- loc,问答页面的url链接,最少出现1次 最多出现1次,类型为URL地址,最小长度1个字符 最大长度256个字符 必须符合正则表达式(http://)(.+) -->
        <lastmod>2013-01-01</lastmod>
        <!-- lastmod,指该条数据的最新一次更新时间,最少出现0次 最多出现1次,类型为日期或日期时间,格式为YYYY-MM-DD的日期或者格式为YYYY-MM-DDThh:mm:ss的日期时间(请注意日期与时间之间以“T”分隔) -->
        <changefreq>always</changefreq>
        <!-- changefreq,指该条数据的更新频率,最少出现0次 最多出现1次,类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
        <priority>1.0</priority>
        <!-- priority,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间,最少出现0次 最多出现1次,类型为小数,最小值为(包含)0.0 最大值为(包含)1.0 -->
        <data>
        <!-- data,,最少出现1次 最多出现1次 -->
            <display>
            <!-- display,,最少出现1次 最多出现1次 -->
                <breadcrumb>生活>保健养生</breadcrumb>
                <!-- breadcrumb: 问题对应分类,该问题所属的类别;不同种类的问答页,类别体系划分不同。各网站可按照自己的分类体系提供到最细一级的分类,最少出现0次 最多出现1次,类型为字符串 -->
                <title>如何减少电脑辐射</title>
                <!-- title: 问题标题,问题的标题,最少出现1次 最多出现1次,类型为字符串 -->
                <link><![CDATA[http://zhidao.baidu.com/question/374362763.html]]></link>
                <!-- link: 问答页链接,问答页面的URL链接,最少出现1次 最多出现1次,类型为字符串 -->
                <status>已解决</status>
                <!-- status: 问题状态,问题的状态,是否已解决等,最少出现0次 最多出现1次,类型为字符串 -->
                <content>如何减少电脑辐射,请教各位</content>
                <!-- content: 问题正文,问题的正文,部分问答标题即已完成问题,而正文为空。,最少出现0次 最多出现1次,类型为字符串 -->
                <questioner>
                <!-- questioner: 提问者,问题帖子的创建人,最少出现1次 最多出现1次 -->
                    <accountName>匿名 </accountName>
                    <!-- accountName: 用户名,提问者的用户名,或者是真实姓名(实名问答社区),最少出现1次 最多出现1次,类型为字符串 -->
                    <gender></gender>
                    <!-- gender: 性别,提问者性别,最少出现0次 最多出现1次,类型为字符串 -->
                    <age>29</age>
                    <!-- age: 年龄,提问者年龄,最少出现0次 最多出现1次,类型为整数 -->
                    <location>北京</location>
                    <!-- location: 所在地,提问者所在的地区,最少出现0次 最多出现1次,类型为字符串 -->
                    <status>还没有宝宝</status>
                    <!-- status: 提问时状态,提问者提问时的状态,最少出现0次 不限制最多出现次数,类型为字符串 -->
                </questioner>
                <post_time>2011-09-24T19:37:00</post_time>
                <!-- post_time: 发帖时间,问题提出的时间,最少出现1次 最多出现1次,类型为日期时间,格式为YYYY-MM-DDThh:mm:ss,请注意日期与时间之间以“T”分隔 -->
                <has_reply>
                <!-- has_reply: 回答帖子,针对此问题给出的回答,最少出现0次 不限制最多出现次数 -->
                    <content>"1、在电脑旁放上几盆仙人掌,它可以有效地吸收辐射; 2、每天上午喝2至3杯的绿茶,吃一个橘子。"</content>
                    <!-- content: 回答内容,回答的主体内容,最少出现1次 最多出现1次,类型为字符串 -->
                    <status>最佳答案</status>
                    <!-- status: 答案状态,"1. 填写内容:“最佳答案”或“推荐答案”或“其他答案” 2. 解释: 1)最佳答案:由提问者评选出的最优答案; 2)推荐答案:提问已结束,但提问者没有选择最佳答案,通过编辑选择等其他方式挑出的最优答案; 3)其他答案:既不是最佳答案也不是推荐答案的答案。 ",最少出现1次 最多出现1次,类型为字符串 -->
                    <replier>
                    <!-- replier: 回答者,回答帖子的创建者,最少出现1次 最多出现1次 -->
                        <accountName>周联生</accountName>
                        <!-- accountName: 用户名,回答者的用户名或者真实姓名/称呼(实名社区),最少出现1次 最多出现1次,类型为字符串 -->
                        <career>健康类</career>
                        <!-- career: 职业,如果回答者是隶属于某专业机构的专业人士,需提供回答者的职业,主要针对健康类、法律类,最少出现0次 最多出现1次,类型为字符串 -->
                        <job_title>主任医师</job_title>
                        <!-- job_title: 职位,如果回答者是隶属于某专业机构的专业人士,需提供回答者的职位,主要针对健康类、法律类,最少出现0次 最多出现1次,类型为字符串 -->
                        <link><![CDATA[http://zhidao.baidu.com/xxxxxx]]></link>
                        <!-- link: 链接,回答者的个人页面链接,最少出现0次 最多出现1次,类型为URL地址 -->
                        <image><![CDATA[http://zhidao.baidu.com/xxxxxxx]]></image>
                        <!-- image: 照片,回答者的照片,最少出现0次 不限制最多出现次数,类型为URL地址 -->
                        <work_for>徐州市第一人民医院 神经内科</work_for>
                        <!-- work_for: 所属机构,"回答者可能是律师、医生、地产经纪等专业人士,需提供其所在的律所、医院/科室、中介机构等所属单位的名称 如果是医生,需标明所在医院和科室,格式为“医院/科室”",最少出现0次 不限制最多出现次数,类型为字符串 -->
                        <grade>二级</grade>
                        <!-- grade: 等级,回答者在问答社区的等级,最少出现0次 最多出现1次,类型为字符串 -->
                        <question_count>2</question_count>
                        <!-- question_count: 提问数量,在问答社区提问的总数量,最少出现0次 最多出现1次,类型为整数 -->
                        <answer_count>26</answer_count>
                        <!-- answer_count: 回答数量,在问答社区回答问题的总数量,最少出现0次 最多出现1次,类型为整数 -->
                        <acceptance_rate>46%</acceptance_rate>
                        <!-- acceptance_rate: 回答采纳率,在问答社区回答问题的被采纳率,最少出现0次 最多出现1次,类型为字符串 -->
                        <like_count>8</like_count>
                        <!-- like_count: 被赞数量,在问答社区回答问题的被赞数量,最少出现0次 最多出现1次,类型为整数 -->
                        <collect_count>4</collect_count>
                        <!-- collect_count: 回答被收藏数量,在问答社区回答问题的被收藏数量,最少出现0次 最多出现1次,类型为整数 -->
                    </replier>
                    <reply_time>2012-02-05T12:24:00</reply_time>
                    <!-- reply_time: 回帖时间,创建回答帖子的时间,最少出现1次 最多出现1次,类型为日期时间,格式为YYYY-MM-DDThh:mm:ss,请注意日期与时间之间以“T”分隔 -->
                    <comment>
                    <!-- comment: 评论,其他用户对此回答的评论,包括3部分,最少出现0次 不限制最多出现次数 -->
                        <creator>zhu13780</creator>
                        <!-- creator: 评论者用户名,评论者的用户名,最少出现0次 最多出现1次,类型为字符串 -->
                        <commentText>不对不对不对好多都是错的</commentText>
                        <!-- commentText: 评论内容,评论的正文内容,最少出现0次 最多出现1次,类型为字符串 -->
                        <commentTime>2013-05-04T11:04:00</commentTime>
                        <!-- commentTime: 评论时间,,最少出现0次 最多出现1次,类型为日期时间,格式为YYYY-MM-DDThh:mm:ss,请注意日期与时间之间以“T”分隔 -->
                    </comment>
                    <evaluation>thanks a lot!</evaluation>
                    <!-- evaluation: 提问者对回答评价,提问者对此回答的评价,最少出现0次 最多出现1次,类型为字符串 -->
                    <additional_question></additional_question>
                    <!-- additional_question: 追问问题,追问的问题内容,最少出现0次 不限制最多出现次数,类型为字符串 -->
                    <additional_reply></additional_reply>
                    <!-- additional_reply: 追问回答内容,追问问题的回答内容,最少出现0次 不限制最多出现次数,类型为字符串 -->
                    <like_count>55</like_count>
                    <!-- like_count: 赞同数量,得到赞的总数量,最少出现0次 最多出现1次,类型为整数 -->
                    <dislike_count>0</dislike_count>
                    <!-- dislike_count: 不赞同数,得到不赞同的总数量,最少出现0次 最多出现1次,类型为整数,最小值为(包含)0 -->
                    <share_count>8</share_count>
                    <!-- share_count: 分享数,回答帖子被分享的总数量,最少出现0次 最多出现1次,类型为整数,最小值为(包含)0 -->
                </has_reply>
                <reply_count>2</reply_count>
                <!-- reply_count: 回答数量,针对此问答帖的回答帖子的总数量,最少出现0次 最多出现1次,类型为整数 -->
                <view_count>100</view_count>
                <!-- view_count: 浏览次数,此问答帖被浏览的次数,最少出现0次 最多出现1次,类型为字符串 -->
                <collect_count>30</collect_count>
                <!-- collect_count: 收藏数,此问题被收藏/关注的数量,最少出现0次 最多出现1次,类型为整数,最小值为(包含)0 -->
                <share_count>25</share_count>
                <!-- share_count: 分享数,此问题被分享的次数,最少出现0次 最多出现1次,类型为整数,最小值为(包含)0 -->
                <keywords>养生</keywords>
                <!-- keywords: 标签,此问答帖子中的关键标签,最少出现0次 不限制最多出现次数,类型为字符串 -->
            </display>
        </data>
    </url>
</urlset>
© 2019 Baidu 使用百度前必读 京ICP证030173号