篩選功能基本上在每個(gè)項(xiàng)目中都會(huì)有,而且篩選的方式也有很多種,根據(jù)客戶的不同要求也會(huì)定制對(duì)數(shù)據(jù)按照要求進(jìn)行篩選,今天的篩選目標(biāo)是,篩選用戶的回復(fù)中不包含圖片的回復(fù)信息。
看起來很困難的樣子,但其實(shí)就是判斷一下回復(fù)的內(nèi)容中是否有img標(biāo)簽,那么就只需要在循環(huán)查詢結(jié)果的時(shí)候判斷內(nèi)容中是否包含img標(biāo)簽。
Python判斷字符串中是否包含img標(biāo)簽可以用find()方法來實(shí)現(xiàn):
也可以通過in()方法來判斷是否存在,用法與find方法相同,但是這兩種方法都是通過判斷字符串是否在字符串中包含可以實(shí)現(xiàn)絕大部分格式統(tǒng)一的字符串來,但是如果字符串中的內(nèi)容被轉(zhuǎn)譯或者格式多個(gè)空格不統(tǒng)一格式的樣子就無法精確判斷。Python中就可以通過Beautifusoup庫(kù)來解決此問題
BeautifulSoup 是一個(gè)用于解析 HTML 和 XML 文檔的 Python 庫(kù),它可以用來提取和操作 HTML 或 XML 中的數(shù)據(jù)。然而,BeautifulSoup 本身并沒有直接提供判斷一個(gè) HTML 或 XML 文檔中是否包含 img 標(biāo)簽的功能。
你可以使用 BeautifulSoup 來解析 HTML 或 XML 文檔,并遍歷文檔中的所有標(biāo)簽來查找 img 標(biāo)簽。例如,下面的代碼演示了如何使用 BeautifulSoup 在一個(gè) HTML 文檔中查找 img 標(biāo)簽。