HTMLのタグを取り除く

作るの面倒だな、どこかにあるだろうなあ、と探してみるとこういうのが見つかった。

http://svn.gaplan.org/gaplan/trunk/wepylog/tools.py

この中のstriptagで解決。感謝。

追記:2008.2.7

久しぶりに探してみると、サイト自体がなくなっている。こっちで代用。 http://www.zope.org/Members/chrisw/StripOGram

追記:2009.10.7

最近は、BeautifulSoupとかlxmlを使うのが良さそう。

http://www.ghastlyfop.com/blog/2008/12/strip-html-tags-from-string-python.htmlより

from BeautifulSoup import BeautifulSoup
''.join(BeautifulSoup(page).findAll(text=True))

質問者もコメントしている人もオーバーヘッドが気に入らないっていってるけれど、僕の使い方では問題なし。