注册

结构化数据_其他_资料下载—XML格式及规范说明:

标签名称 标签说明 标签类型 标签限制 可选/必选 举例
urlset urlset用来标记整个文档的开头 // 必选
url url标记每条信息的开始和结束 // 可选
最多出现50000次
loc 资料页面的url链接 任意URL最小长度1个字符
最大长度256个字符
符合正则表达式(http://)(.+)
必选
lastmod 指该条数据的最新一次更新时间 日期或日期时间格式为:YYYY-MM-DD[Thh:mm:ss],日期与时间之间使用T分隔,可以仅提供年月日部分 可选 2013-01-01
changefreq 指该条数据的更新频率 字符串有效值为:always、hourly、daily、weekly、monthly、yearly、never 可选 always
priority 用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间 小数大于等于0.0
小于等于1.0
可选 1.0
data // 必选
display // 必选
breadcrumb 资料所在页面的面包屑导航 字符串 必选 资料分类 > 教育资料 > 高等教育
name 资料的名称 字符串 必选 杜绝舌尖上的浪费规范化文件标准讲义.ppt
description 资料的简介 字符串 可选 帮助文件管理,理清头绪。
url 资料页面的URL链接 任意URL 可选
genre 资料的类型,如软件类、文档类、工具类等; 字符串 可选 文档类
filetype "资料的格式,如: PDF;PDF文档;ppt;PPT;PPTX;PPT文档;TXT;TXT文档;DOC;DOCX;Word文档;XLS;XLSX;Excel文档;RTF;RTF文档;图片;图片文件;HTML/CHM;HTML/CHM文件;EXE;EXE文件;ZIP;RAR;压缩文件;Flash;其他" 字符串 必选 ppt
fileSize 资料的大小,最少字符数3 字符串 必选 112KB
downloadCoins 下载资料需要的积分,最少字符数1 整数 可选 5
provider 资料的上传者 // 可选
datePublished 资料的上传日期 字符串 可选 2013-7-9 19:48
downloadCount 资料的下载次数 整数 可选 0
collectCount 资料被收藏的总数量 整数 可选 0
likeCount 资料被顶/喜欢的总数量 整数 可选 0
shareCount 资料被分享的总数量 整数 可选 0
commentCount 资料的评论数量 整数 可选 1
keywords 资料的标签 字符串 可选
不限制最多出现次数
规范化
downloadUrl 资料下载的URL链接 任意URL 必选
不限制最多出现次数
http://ishare.iask.sina.com.cn/download/explain.php?fileid=37496046
aggregateRating 资料的综合评价 // 可选
comment 资料的评论 // 可选
不限制最多出现次数
provider
name 上传者的名称 字符串 可选 happy
url 上传者页面的URL链接 任意URL 可选
不限制最多出现次数
http://iask.sina.com.cn/user/user.php?uid=1749681582
aggregateRating
ratingValue 综合评价的评价分 整数 可选 3
bestRating 综合评价的最高分 整数 可选 5
ratingCount 综合评价的评价数量 整数 可选 50
comment
commentText 评论中的文本内容 字符串 可选 文档不错
creator 评论的发表者 字符串 可选 山中一老虎
commentTime 评论的发表时间 字符串 可选 2013-7-9 20:20

XML格式举例

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<!-- urlset,urlset用来标记整个文档的开头,最少出现1次 最多出现1次 -->
    <url>
    <!-- url,url标记每条信息的开始和结束,最少出现0次 最多出现50000次 -->
        <loc><![CDATA[http://ishare.iask.sina.com.cn/f/37496046.html]]></loc>
        <!-- loc,资料页面的url链接,最少出现1次 最多出现1次,类型为URL地址,最小长度1个字符 最大长度256个字符 必须符合正则表达式(http://)(.+) -->
        <lastmod>2013-01-01</lastmod>
        <!-- lastmod,指该条数据的最新一次更新时间,最少出现0次 最多出现1次,类型为日期或日期时间,格式为YYYY-MM-DD的日期或者格式为YYYY-MM-DDThh:mm:ss的日期时间(请注意日期与时间之间以“T”分隔) -->
        <changefreq>always</changefreq>
        <!-- changefreq,指该条数据的更新频率,最少出现0次 最多出现1次,类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
        <priority>1.0</priority>
        <!-- priority,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间,最少出现0次 最多出现1次,类型为小数,最小值为(包含)0.0 最大值为(包含)1.0 -->
        <data>
        <!-- data,,最少出现1次 最多出现1次 -->
            <display>
            <!-- display,,最少出现1次 最多出现1次 -->
                <breadcrumb>资料分类 > 教育资料 > 高等教育</breadcrumb>
                <!-- breadcrumb: 面包屑导航,资料所在页面的面包屑导航,最少出现1次 最多出现1次,类型为字符串 -->
                <name>杜绝舌尖上的浪费规范化文件标准讲义.ppt</name>
                <!-- name: 资料名称,资料的名称,最少出现1次 最多出现1次,类型为字符串 -->
                <description>帮助文件管理,理清头绪。</description>
                <!-- description: 资料说明,资料的简介,最少出现0次 最多出现1次,类型为字符串 -->
                <url><![CDATA[http://ishare.iask.sina.com.cn/f/37496046.html]]></url>
                <!-- url: 资料页面链接,资料页面的URL链接,最少出现0次 最多出现1次,类型为URL地址 -->
                <genre>文档类</genre>
                <!-- genre: 资源类型,资料的类型,如软件类、文档类、工具类等;,最少出现0次 最多出现1次,类型为字符串 -->
                <filetype>ppt</filetype>
                <!-- filetype: 资料格式,"资料的格式,如: PDF;PDF文档;ppt;PPT;PPTX;PPT文档;TXT;TXT文档;DOC;DOCX;Word文档;XLS;XLSX;Excel文档;RTF;RTF文档;图片;图片文件;HTML/CHM;HTML/CHM文件;EXE;EXE文件;ZIP;RAR;压缩文件;Flash;其他",最少出现1次 最多出现1次,类型为字符串 -->
                <fileSize>112KB</fileSize>
                <!-- fileSize: 资料大小,资料的大小,最少字符数3,最少出现1次 最多出现1次,类型为字符串 -->
                <downloadCoins>5</downloadCoins>
                <!-- downloadCoins: 下载积分,下载资料需要的积分,最少字符数1,最少出现0次 最多出现1次,类型为整数 -->
                <provider>
                <!-- provider: 上传者,资料的上传者,最少出现0次 最多出现1次 -->
                    <name>happy</name>
                    <!-- name: 名称,上传者的名称,最少出现0次 最多出现1次,类型为字符串 -->
                    <url>http://iask.sina.com.cn/user/user.php?uid=1749681582</url>
                    <!-- url: 页面链接,上传者页面的URL链接,最少出现0次 不限制最多出现次数,类型为URL地址 -->
                </provider>
                <datePublished>2013-7-9 19:48</datePublished>
                <!-- datePublished: 上传日期,资料的上传日期,最少出现0次 最多出现1次,类型为字符串 -->
                <downloadCount>0</downloadCount>
                <!-- downloadCount: 下载次数,资料的下载次数,最少出现0次 最多出现1次,类型为整数 -->
                <collectCount>0</collectCount>
                <!-- collectCount: 收藏次数,资料被收藏的总数量,最少出现0次 最多出现1次,类型为整数 -->
                <likeCount>0</likeCount>
                <!-- likeCount: 被顶次数,资料被顶/喜欢的总数量,最少出现0次 最多出现1次,类型为整数 -->
                <shareCount>0</shareCount>
                <!-- shareCount: 分享次数,资料被分享的总数量,最少出现0次 最多出现1次,类型为整数 -->
                <commentCount>1</commentCount>
                <!-- commentCount: 评论次数,资料的评论数量,最少出现0次 最多出现1次,类型为整数 -->
                <keywords>规范化</keywords>
                <!-- keywords: 标签,资料的标签,最少出现0次 不限制最多出现次数,类型为字符串 -->
                <downloadUrl>http://ishare.iask.sina.com.cn/download/explain.php?fileid=37496046</downloadUrl>
                <!-- downloadUrl: 下载链接,资料下载的URL链接,最少出现1次 不限制最多出现次数,类型为URL地址 -->
                <aggregateRating>
                <!-- aggregateRating: 综合评价,资料的综合评价,最少出现0次 最多出现1次 -->
                    <ratingValue>3</ratingValue>
                    <!-- ratingValue: 评价分,综合评价的评价分,最少出现0次 最多出现1次,类型为整数 -->
                    <bestRating>5</bestRating>
                    <!-- bestRating: 最高分,综合评价的最高分,最少出现0次 最多出现1次,类型为整数 -->
                    <ratingCount>50</ratingCount>
                    <!-- ratingCount: 评价数量,综合评价的评价数量,最少出现0次 最多出现1次,类型为整数 -->
                </aggregateRating>
                <comment>
                <!-- comment: 评论,资料的评论,最少出现0次 不限制最多出现次数 -->
                    <commentText>文档不错</commentText>
                    <!-- commentText: 评论内容,评论中的文本内容,最少出现0次 最多出现1次,类型为字符串 -->
                    <creator>山中一老虎</creator>
                    <!-- creator: 评论者,评论的发表者,最少出现0次 最多出现1次,类型为字符串 -->
                    <commentTime>2013-7-9 20:20</commentTime>
                    <!-- commentTime: 评论时间,评论的发表时间,最少出现0次 最多出现1次,类型为字符串 -->
                </comment>
            </display>
        </data>
    </url>
</urlset>
© 2019 Baidu 使用百度前必读 京ICP证030173号