在PHP中,你可以使用内置的函数 strip_tags()
来去除HTML标签。这个函数会从字符串中删除所有的HTML和PHP标签,只保留纯文本内容。
strip_tags()
函数<?php
$html = "<p>这是一个<b>加粗</b>的段落。</p>";
$plainText = strip_tags($html);
echo $plainText;
?>
输出:
这是一个加粗的段落。
strip_tags(string $str, string $allowable_tags = null): string
$str
: 输入的字符串,包含HTML标签。$allowable_tags
: 可选参数,指定允许保留的标签。你可以在这个参数中列出你希望保留的标签。如果你希望保留某些标签(例如 <b>
和 <i>
),可以这样做:
<?php
$html = "<p>这是一个<b>加粗</b>的段落。</p>";
$plainText = strip_tags($html, "<b><i>");
echo $plainText;
?>
输出:
这是一个<b>加粗</b>的段落。
strip_tags()
函数不会处理HTML实体(如 &
、<
等),如果你需要处理这些实体,可以使用 html_entity_decode()
函数。DOMDocument
类或其他HTML解析库。DOMDocument
类如果你需要更复杂的HTML处理,可以使用 DOMDocument
类来解析和操作HTML文档。
<?php
$html = "<p>这是一个<b>加粗</b>的段落。</p>";
$dom = new DOMDocument();
@$dom->loadHTML($html); // 使用 @ 抑制警告
$plainText = $dom->textContent;
echo $plainText;
?>
输出:
这是一个加粗的段落。
这种方法适合处理更复杂的HTML文档,并且可以更灵活地操作DOM元素。