一直都没有用过采集,昨天体验了一把织梦自带的采集功能,感觉效果刚刚的。但是也有一些问题很快就凸现出来了。例如利用织梦采集功能自带的过滤超链接规则时,会直接将链接文本内容也过滤掉,这样就造成了采集文章的不完整,给文章阅读用户带来不好的体验。而我们需要达到的只是删除超链接的效果。
织梦默认的过滤超链接规则如下文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
在网上查找后发现,只需将以上的过滤规则改为如下的过滤规则,就能完美的解决过滤超链接不保留文本的问题。文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
{dede:trim replace=""}<(|/)a([^>]*)>{/dede:trim}文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
也希望织梦在新版本发布的时候能修改一下这方面的问题,给用户带来更好的体验。文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
文章源自堕落的鱼-https://www.duoluodeyu.com/701.html
修改规则引用地址文章源自堕落的鱼-https://www.duoluodeyu.com/701.html 文章源自堕落的鱼-https://www.duoluodeyu.com/701.html