注册

结构化数据_其他_在线文档—XML格式及规范说明:

标签名称 标签说明 标签类型 标签限制 可选/必选 举例
urlset urlset用来标记整个文档的开头 // 必选
url url标记每条信息的开始和结束 // 可选
最多出现50000次
loc 文档页面的URL链接 任意URL最小长度1个字符
最大长度256个字符
符合正则表达式(http://)(.+)
必选
lastmod 指该条数据的最新一次更新时间 日期或日期时间格式为:YYYY-MM-DD[Thh:mm:ss],日期与时间之间使用T分隔,可以仅提供年月日部分 可选 2013-01-01
changefreq 指该条数据的更新频率 字符串有效值为:always、hourly、daily、weekly、monthly、yearly、never 可选 always
priority 用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间 小数大于等于0.0
小于等于1.0
可选 1.0
data // 必选
display // 必选
breadcrumb 文档所在页面的面包屑导航 字符串 必选 所有文档>>教材教辅>>外语>>杜绝舌尖上的浪费
name 文档的名称 字符串 必选 杜绝舌尖上的浪费
description 文档的简介 字符串 可选 道客巴巴精品文档 舌尖上的浪费 拒绝舌尖上的浪费 舌尖上的浪费漫画 舌尖上浪费 舌尖上的浪费 申论 舌尖上的浪费作文 舌尖上的浪费ppt 舌尖上的浪费手抄报 舌尖上的浪费歌曲 关于舌尖上的浪费
url 文档页面的URL链接 任意URL 可选
genre 文档的分类 字符串 必选 外语
fileFormat "文档的格式,如: PDF;PDF文档;PPT;PPTX;PPT文档;TXT;TXT文档;DOC;DOCX;Word文档;XLS;XLSX;Excel文档;RTF;RTF文档;图片;图片文件;HTML/CHM;HTML/CHM文件;EXE;EXE文件;ZIP;RAR;压缩文件;其他" 字符串 可选 PPT
pageCount 文档的页数。最小值为1 整数大于等于1 可选 14
wordCount 文档的总字数 整数 可选 1
keywords 文档的标签 字符串 可选
不限制最多出现次数
舌尖上
articleBody 文档的主体内容 字符串 可选 wu
downloadCoins 最少字符数1 字符串 可选 840
provider 文档的上传人 // 必选
datePublished 文档的上传时间 字符串 必选 2013-7-4 18:49
popularity 文档的欢迎程度 字符串 可选 wu
star 文档的星级 字符串 可选 wu
viewCount 文档被浏览的次数 整数 可选 853
likeCount 文档被顶的次数 整数 可选 50
dislikeCount 文档被踩的次数 整数 可选 0
collectCount 文档被收藏的总次数 整数 可选 25
comment 有关文档的评论 // 可选
不限制最多出现次数
commentCount 文档被评论的总次数 整数 可选 1
shareCount 文档被分享的总次数 整数 可选 1
aggregateRating 文档的综合评价 // 可选
downloadUrl 文档的下载地址 任意URL 可选 1
isOriginal 文档的性质,如原创,转载等 字符串 可选 TRUE
fileSize 文档的大小 字符串 可选 2.1M
provider
name 上传人的姓名或用户名 字符串 必选 xxuemetn
level 上传人的等级 字符串 可选 小学三年级
area 上传人的关注领域 字符串 可选
不限制最多出现次数
建筑/环境
url 上传人的个人主页 任意URL 可选 http://www.doc88.com/xxuemetn
documentCount 上传人的文档总数 整数 可选 22433
documentViewCount 上传人的文档浏览次数 整数 可选 155230
documentCollectCount 上传人的文档收藏次数 整数 可选 294
comment
commentText 评论的内容 字符串 可选 很感谢,这篇文档非常赞
commentTime 评论的时间 字符串 可选 2013-7-8 20:04
creator 评论的创建者 字符串 可选 时光不在
aggregateRating
ratingValue 综合评价的评价分 小数小数位数
数字位数
可选 4.5
bestRating 综合评价的最高分 小数小数位数
数字位数
可选 5
ratingCount 综合评价中参与评价的数量 整数 可选 380

XML格式举例

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<!-- urlset,urlset用来标记整个文档的开头,最少出现1次 最多出现1次 -->
    <url>
    <!-- url,url标记每条信息的开始和结束,最少出现0次 最多出现50000次 -->
        <loc><![CDATA[http://www.doc88.com/p-1714777566711.html]]></loc>
        <!-- loc,文档页面的URL链接,最少出现1次 最多出现1次,类型为URL地址,最小长度1个字符 最大长度256个字符 必须符合正则表达式(http://)(.+) -->
        <lastmod>2013-01-01</lastmod>
        <!-- lastmod,指该条数据的最新一次更新时间,最少出现0次 最多出现1次,类型为日期或日期时间,格式为YYYY-MM-DD的日期或者格式为YYYY-MM-DDThh:mm:ss的日期时间(请注意日期与时间之间以“T”分隔) -->
        <changefreq>always</changefreq>
        <!-- changefreq,指该条数据的更新频率,最少出现0次 最多出现1次,类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
        <priority>1.0</priority>
        <!-- priority,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间,最少出现0次 最多出现1次,类型为小数,最小值为(包含)0.0 最大值为(包含)1.0 -->
        <data>
        <!-- data,,最少出现1次 最多出现1次 -->
            <display>
            <!-- display,,最少出现1次 最多出现1次 -->
                <breadcrumb>所有文档>>教材教辅>>外语>>杜绝舌尖上的浪费</breadcrumb>
                <!-- breadcrumb: 面包屑导航,文档所在页面的面包屑导航,最少出现1次 最多出现1次,类型为字符串 -->
                <name>杜绝舌尖上的浪费</name>
                <!-- name: 文档名称,文档的名称,最少出现1次 最多出现1次,类型为字符串 -->
                <description>道客巴巴精品文档 舌尖上的浪费 拒绝舌尖上的浪费 舌尖上的浪费漫画 舌尖上浪费 舌尖上的浪费 申论 舌尖上的浪费作文 舌尖上的浪费ppt 舌尖上的浪费手抄报 舌尖上的浪费歌曲 关于舌尖上的浪费</description>
                <!-- description: 文档简介,文档的简介,最少出现0次 最多出现1次,类型为字符串 -->
                <url><![CDATA[http://www.doc88.com/p-1714777566711.html]]></url>
                <!-- url: 文档链接,文档页面的URL链接,最少出现0次 最多出现1次,类型为URL地址 -->
                <genre>外语</genre>
                <!-- genre: 文档分类,文档的分类,最少出现1次 最多出现1次,类型为字符串 -->
                <fileFormat>PPT</fileFormat>
                <!-- fileFormat: 文档格式,"文档的格式,如: PDF;PDF文档;PPT;PPTX;PPT文档;TXT;TXT文档;DOC;DOCX;Word文档;XLS;XLSX;Excel文档;RTF;RTF文档;图片;图片文件;HTML/CHM;HTML/CHM文件;EXE;EXE文件;ZIP;RAR;压缩文件;其他",最少出现0次 最多出现1次,类型为字符串 -->
                <pageCount>14</pageCount>
                <!-- pageCount: 文档页数,文档的页数。最小值为1,最少出现0次 最多出现1次,类型为整数,最小值为(包含)1 -->
                <wordCount>1</wordCount>
                <!-- wordCount: 文档字数,文档的总字数,最少出现0次 最多出现1次,类型为整数 -->
                <keywords>舌尖上</keywords>
                <!-- keywords: 文档标签,文档的标签,最少出现0次 不限制最多出现次数,类型为字符串 -->
                <articleBody>wu</articleBody>
                <!-- articleBody: 文档主体,文档的主体内容,最少出现0次 最多出现1次,类型为字符串 -->
                <downloadCoins>840</downloadCoins>
                <!-- downloadCoins: 下载积分,最少字符数1,最少出现0次 最多出现1次,类型为字符串 -->
                <provider>
                <!-- provider: 上传者,文档的上传人,最少出现1次 最多出现1次 -->
                    <name>xxuemetn</name>
                    <!-- name: 姓名,上传人的姓名或用户名,最少出现1次 最多出现1次,类型为字符串 -->
                    <level>小学三年级</level>
                    <!-- level: 等级,上传人的等级,最少出现0次 最多出现1次,类型为字符串 -->
                    <area>建筑/环境</area>
                    <!-- area: 关注领域,上传人的关注领域,最少出现0次 不限制最多出现次数,类型为字符串 -->
                    <url>http://www.doc88.com/xxuemetn</url>
                    <!-- url: 个人主页,上传人的个人主页,最少出现0次 最多出现1次,类型为URL地址 -->
                    <documentCount>22433</documentCount>
                    <!-- documentCount: 文档总数,上传人的文档总数,最少出现0次 最多出现1次,类型为整数 -->
                    <documentViewCount>155230</documentViewCount>
                    <!-- documentViewCount: 文档浏览次数,上传人的文档浏览次数,最少出现0次 最多出现1次,类型为整数 -->
                    <documentCollectCount>294</documentCollectCount>
                    <!-- documentCollectCount: 文档收藏次数,上传人的文档收藏次数,最少出现0次 最多出现1次,类型为整数 -->
                </provider>
                <datePublished>2013-7-4 18:49</datePublished>
                <!-- datePublished: 上传时间,文档的上传时间,最少出现1次 最多出现1次,类型为字符串 -->
                <popularity>wu</popularity>
                <!-- popularity: 文档热度,文档的欢迎程度,最少出现0次 最多出现1次,类型为字符串 -->
                <star>wu</star>
                <!-- star: 文档星级,文档的星级,最少出现0次 最多出现1次,类型为字符串 -->
                <viewCount>853</viewCount>
                <!-- viewCount: 浏览次数,文档被浏览的次数,最少出现0次 最多出现1次,类型为整数 -->
                <likeCount>50</likeCount>
                <!-- likeCount: 被顶数量,文档被顶的次数,最少出现0次 最多出现1次,类型为整数 -->
                <dislikeCount>0</dislikeCount>
                <!-- dislikeCount: 被踩数量,文档被踩的次数,最少出现0次 最多出现1次,类型为整数 -->
                <collectCount>25</collectCount>
                <!-- collectCount: 收藏数量,文档被收藏的总次数,最少出现0次 最多出现1次,类型为整数 -->
                <comment>
                <!-- comment: 评论,有关文档的评论,最少出现0次 不限制最多出现次数 -->
                    <commentText>很感谢,这篇文档非常赞</commentText>
                    <!-- commentText: 评论内容,评论的内容,最少出现0次 最多出现1次,类型为字符串 -->
                    <commentTime>2013-7-8 20:04</commentTime>
                    <!-- commentTime: 评论时间,评论的时间,最少出现0次 最多出现1次,类型为字符串 -->
                    <creator>时光不在</creator>
                    <!-- creator: 评论者,评论的创建者,最少出现0次 最多出现1次,类型为字符串 -->
                </comment>
                <commentCount>1</commentCount>
                <!-- commentCount: 评论数量,文档被评论的总次数,最少出现0次 最多出现1次,类型为整数 -->
                <shareCount>1</shareCount>
                <!-- shareCount: 分享数量,文档被分享的总次数,最少出现0次 最多出现1次,类型为整数 -->
                <aggregateRating>
                <!-- aggregateRating: 综合评价,文档的综合评价,最少出现0次 最多出现1次 -->
                    <ratingValue>4.5</ratingValue>
                    <!-- ratingValue: 评价分,综合评价的评价分,最少出现0次 最多出现1次,类型为小数 -->
                    <bestRating>5</bestRating>
                    <!-- bestRating: 最高分,综合评价的最高分,最少出现0次 最多出现1次,类型为小数 -->
                    <ratingCount>380</ratingCount>
                    <!-- ratingCount: 评价数量,综合评价中参与评价的数量,最少出现0次 最多出现1次,类型为整数 -->
                </aggregateRating>
                <downloadUrl>1</downloadUrl>
                <!-- downloadUrl: 下载链接,文档的下载地址,最少出现0次 最多出现1次,类型为URL地址 -->
                <isOriginal>TRUE</isOriginal>
                <!-- isOriginal: 文档性质,文档的性质,如原创,转载等,最少出现0次 最多出现1次,类型为字符串 -->
                <fileSize>2.1M</fileSize>
                <!-- fileSize: 文档大小,文档的大小,最少出现0次 最多出现1次,类型为字符串 -->
            </display>
        </data>
    </url>
</urlset>
© 2019 Baidu 使用百度前必读 京ICP证030173号