温馨提示:本文翻译自stackoverflow.com，查看原文请点击：其他 - Preserve text format on read/write to shape text python pptx

python text python-pptx

其他 - 在读取/写入时保留文本格式以形成文本python pptx

发布于 2020-04-09 11:40:30

我想在形状的文本中执行文本替换。我正在使用类似于以下代码段的代码：

# define key/value
SRKeys, SRVals = ['x','y','z'], [1,2,3]

# define text
text = shape.text

# iterate through values and perform subs
for i in range(len(SRKeys)):
    # replace text
    text = text.replace(SRKeys[i], str(SRVals[i]))

# write text subs to comment box
shape.text = text

但是，如果首字母shape.text具有格式化字符（例如，以粗体表示），则在读取时会删除该格式化。有解决方案吗？

我唯一想到的就是遍历字符并检查格式，然后在写入之前添加这些格式shape.text。

提问者

Michael Berk

被浏览

83

查看英文版

查看原文

scanny 2020-02-02 06:05

@ usr2564301在正确的轨道上。在运行级别指定字符格式（也称为“字体”）。这就是奔跑。所有共享相同字符格式的字符的“运行”（序列）。

分配给shape.text您时，将所有以前使用的运行替换为具有默认格式的一个新运行。如果要保留格式，则需要保留文本替换中不直接涉及的所有运行。

这不是一个小问题，因为不能保证在字边界上中断。尝试将运行结果打印出几段，我想您会明白我的意思的。

在粗略的伪代码中，我认为这是您需要采取的方法：

在段落中搜索目标文本以确定其第一个字符的偏移量。
遍历该段中的所有运行，并在运行前保持运行前总共有多少个字符，例如（run_idx，prefix_len，length）：（0，0，8），（1，8，4），（2 ，12、9）等。
确定哪个运行是涉及您的搜索字符串的开始，结束和中间运行。
在搜索词的开头分割第一轮，在搜索词的末尾分割最后的轮，并删除除“中间”轮的第一轮以外的所有轮。
将中间运行的文本更改为替换文本，并从先前（原始开始）运行中复制格式。也许这是您在拆分开始时所做的最后一点。

这将保留所有不涉及搜索字符串的运行，并保留“已替换”字词中“匹配”字词的格式。

这需要一些当前API不直接支持的操作。对于那些用户，您可以使用低级lxml调用直接操作XML，尽管您可以从python-pptx对象中获取所需的所有现有元素，而不必自己解析XML。

Michael Berk 2020-02-03 05:16:28

感谢您的回答-它有效！我写了一个效率不高的解决方案，但对代码却非常直接：1）遍历运行并存储文本和格式。2）对存储的文本执行文本替换。3）清除段落并写下每次运行（使用新的文本和格式）。注意：因为您无法编写run.font，所以必须选择要存储的字体属性（不理想）。

Guilherme Henrique Mendes 2020-03-30 05:26:59

@MichaelBerk您可以分享您的代码/解决方案吗？

相关问题

1

如何使用python cut方法创建bin，接受一个参数并返回适当的bin？

2

从具有特定条件的列表列表创建字典

3

根据行值选择列，Python，Pandas

4

在数据框中绘制零和一的计数

5

python函数。

6

在两个DataFrame之间执行大量Pandas查找的最佳方法

7

如何获取Pandas数据透视表中的列数和每列的宽度？

8

在Pandas数据框中分组时缺少所需值时显示一列

9

Python隐藏壁虱但显示壁虱标签

10

获取Entry和checkbutton值Tkinter时出现问题

热门github

1

Python tool for converting files and office documents to Markdown.

2

All Algorithms implemented in Python (翻译：用 Python 实现的所有算法)

3

A command line tool and library for transferring data with URL syntax, supporting DICT, FILE, FTP, FTPS, GOPHER, GOPHERS, HTTP, HTTPS, IMAP, IMAPS, LDAP, LDAPS, MQTT, POP3, POP3S, RTMP, RTMPS, RTSP, SCP, SFTP, SMB, SMBS, SMTP, SMTPS, TELNET, TFTP, WS and WSS. libcurl offers a myriad of powerful features (翻译：Curl 是一个命令行工具，用于传输使用 URL 语法指定的数据。)

4

Flutter makes it easy and fast to build beautiful apps for mobile and beyond (翻译：Flutter 可以轻松快速地为移动设备及其他应用构建漂亮的应用程序)

5

Tongyi DeepResearch, the Leading Open-source DeepResearch Agent

6

7

Open-source framework for conversational voice AI agents.

8

A complete computer science study plan to become a software engineer. (翻译：一个如何成为软件工程师的完整、科学的学习计划。)

9

AI wearables. Put it on, speak, transcribe, automatically

10

Main repository for the Linera protocol

11

基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.

12

3D Reconstruction for all

13

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages. (翻译：PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。)

14

Fine-tuning & Reinforcement Learning for LLMs. 🦥 Train OpenAI gpt-oss, Qwen3, Llama 4, DeepSeek-R1, Gemma 3, TTS 2x faster with 70% less VRAM.

15

Lightweight coding agent that runs in your terminal