在使用 OpenXML SDK 进行 Office 文档的解析时,对幻灯片 PPTX 文档的页面解析也许会遇到页面顺序的问题,本文告诉大家在 Office 文档里面页面的序号和顺序之间的关系以及如何读取页面序号
在开始之前,我期望你是了解一些 PPT 解析的相关知识的,入门级博客请看 C# dotnet 使用 OpenXml 解析 PPT 文件
更多博客请看 Office 使用 OpenXML SDK 解析文档博客目录
在 C# dotnet 使用 OpenXml 解析 PPT 文件 这篇博客中没有详细告诉大家页面顺序的问题,但是按照 C# dotnet 使用 OpenXml 解析 PPT 文件 这篇博客的写法就是能拿到对的页面顺序
在 ECMA 376 标准中说明,在 Presentation.xml 文档将会记录页面的顺序和页面的 Id 值,也就是 Slide Id 值,代码大概如下
<p:sldIdLst>
<p:sldId id="277" r:id="rId2" />
</p:sldIdLst>
这里的 p:sldIdLst
将会存放在 PPT 画布里面多个页面之间的顺序,上面代码中页面的 Slide Id 是 id
这个属性,也就是当前的文档只有一个页面,这个页面的 Slide Id 是 277
的值。而后面的 r:id="rId2"
这个指的是文档压缩包里面的资源路径,可以通过这个属性找到对应的页面数据,请看下面代码
var slideIdList = presentation.SlideIdList;
foreach (var slideId in slideIdList.ChildElements.OfType<SlideId>())
{
// 获取页面内容
SlidePart slidePart = (SlidePart) presentationPart.GetPartById(slideId.RelationshipId);
// 忽略代码
}
上面代码的 slideId.RelationshipId
就是对应 r:id
属性。这个属性是通用的属性,详细请看 Office 文档解析 文档格式和协议
而 id="277"
的 id
需要使用 slideId.Id
读取,请看下面代码
public void Foo(FIleInfo file)
{
using var document = PresentationDocument.Open(file.OpenRead(), isEditable: false);
var openXmlPresentation = document.PresentationPart.Presentation;
var slideIdList = openXmlPresentation.SlideIdList;
foreach (var slideId in slideIdList.ChildElements.OfType<SlideId>())
{
var id = slideId.Id;
}
}
如何了解自己读取到的值是否是对的?试试使用 COM 的方式,或者创建一个 VSTO 插件,试试使用下面代码获取
var application = new Application();
var presentation = application.Presentations.Open(file, MsoTriState.msoTrue,
MsoTriState.msoFalse,
MsoTriState.msoFalse);
foreach (Microsoft.Office.Interop.PowerPoint.Slide presentationSlide in presentation.Slides)
{
var slideId = presentationSlide.SlideID;
}
这部分细节在 ECMA 376 文档提到的不多,请看 19.2.1.33 sldId (Slide ID) 和 19.2.1.34 sldIdLst (List of Slide IDs) 这两章
我写了很多 Office 解析相关的博客,请看 Office 使用 OpenXML SDK 解析文档博客目录
本文会经常更新,请阅读原文: https://blog.lindexi.com/post/dotnet-OpenXML-%E5%B9%BB%E7%81%AF%E7%89%87-PPTX-%E7%9A%84-Slide-Id-%E5%92%8C%E9%A1%B5%E9%9D%A2%E5%BA%8F%E5%8F%B7%E7%9A%84%E5%85%B3%E7%B3%BB.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。
如果你想持续阅读我的最新博客,请点击 RSS 订阅,推荐使用RSS Stalker订阅博客,或者收藏我的博客导航
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名林德熙(包含链接: https://blog.lindexi.com ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系 。
无盈利,不卖课,做纯粹的技术博客
以下是广告时间
推荐关注 Edi.Wang 的公众号
欢迎进入 Eleven 老师组建的 .NET 社区
以上广告全是友情推广,无盈利