chocolablog ver 0.6 にアップデートしました
本日未明に Python 製自家製ブログの chocolablog を ver 0.6 にアップデートしました。前回の ver 0.5 が 2012 年 3 月 8 日なので、実に 1 年 2 ヶ月ぶりのアップデートとなります。
この間に何があったのかと言うと、実は去年の秋頃に chocolablog を使いたいという友人が現れ、めでたくも初の利用ユーザーさんが誕生しました。嬉しいことです。それにともなって機能拡張やバグ修正をこっそりと繰り返していた(フッターのバージョンが 0.5 → 0.5g になったりしていた)のですが、いい加減に数も溜まってきたのでそろそろバージョンを上げることにしました。
今回のアップデート内容は、システム管理画面でブログの設定を変更できるようにしたり、スパムコメント対策としてフィルタリング機能(ある条件のコメントを自動でブラックリストに入れ、表示させなくする)を追加したりといった、ブログ管理者向けの機能が強化されています。特にスパムコメントについては、それほどアクセスの多くないうちのサイトでも気づけばひと月に 1000 件近く溜まるようになっていて、実運用を続ける上では重要な要件になってきていました。(最近 MeCab での形態素解析を扱っていたのは、スパムフィルターとして文書分類機能を実装するためでした)
もうひとつの大きな変更点として、URL の整理が行われています。これまではすべてのページの URL が CGI そのまま .cgi で終わる形になっていましたが、拡張子を削り、また WEB リソースを表すものとして適切名前に置き換えています。例えば、ブログの記事の URL は、これまでは http://chocolapod.sakura.ne.jp/blog/view.cgi?entryId=57 でしたが、http://chocolapod.sakura.ne.jp/blog/entry/57 に変更されています。CGI ファイルとパラメーターの名前が短くすっきりしました。
古い URL は、既に検索エンジンにクロールされていたり、他のブログで紹介していただいていたりしていますので、引き続きアクセスできるようになっています。旧 URL から対応する新 URL に自動でリダイレクトするよう設定してあります。
※万が一エラー等出るようでしたらご連絡くださいませ。
ver0.6 の追加機能
・コメント投稿時にパスワードを設定できるように・ボットによるコメントスパム対策を強化
・システム管理画面にコメント管理画面を追加
・コメント投稿時に特定の条件に合致するものを自動でブラックリストに入れ、非表示とする
・ブラックリスト入りの条件は、特定のURLを含む、特定の IP からの投稿を任意で設定できるように
・コメントをブラックリストに入っているいないで分類して表示できるように
・複数コメントの一括で承認、ブラックリストに追加、コメント削除できるように
・システム管理画面からの記事、タグ、コメント、ユーザー等の削除時に確認ダイアログを表示するように
・システム管理画面で以下の設定を変更できるように
・ブログ名
・ユーザー名
・ユーザーのプロフィール文
・ユーザーのプロフィール画像
・ブログのヘッダースタイル(縦幅、背景画像、ブログ名の位置・色)
・背景色、見出し(大・中)の色、ブログパーツのタイトルの色、リンクの色
・ブログパーツの ON / OFF 設定
・コメントの事前承認、投稿者の IP 表示、パスワードによるコメント削除機能の ON / OFF
・Amazon アフィリエイトアカウント、
・ブログパーツ用 twitter アカウント
・アクセスログの過去分を月単位で保持する
・アクセスログの集計方法に以下の 3 つを追加
・外部サイトのリンクからの流入
・検索エンジンからの流入
・RSS からの流入
・Baidu, Yeti, Msnbot をからのアクセスをボットアクセスとして扱うように
・アクセスログ一覧に前回のアクセスからの経過時間を表示するように
・アクセスログにステータスコード(通常アクセス、リダイレクト、不正リクエスト)を表示するように
・アクセスログ一覧の UI 改善
・RSS フィードに本文へのリンクを追加
・sitemap.xml を追加
・chocola 記法の機能拡張
・ニコニコ動画タグの埋め込み
・テキストの組み込み書式として 注意用スタイル、補足用スタイル、フォーマル用スタイルを追加
・twitter ブログパーツの追加
・リッチエディタで画像のサイズを直接入力できるように
・URL を .cgi から RESE 形式に変更、旧 URL から新 URL へ自動リダイレクトするように
コメントスパムへの方針
今回の機能拡張で実感したのは、やはりコメントスパム対策の難しさでした。記事の投稿頻度が上がるとしているとボットのクローラーのアクセス頻度も上がるのか、コメントスパムの量が増えてきます。今まではひとまずすべて POST させておいて、(管理者による承認機能やユーザー認証機能で)あとからコメントスパムを取り除く、という方針でした。ですが、毎回それなりの量のテキストデータを POST してくるので DB サイズの増加量も馬鹿にならず、今回は自動投稿らしき書き込みは受け付けない方向に方針転換しています。うちのブログではコメントは管理者による承認制をとっているので投稿後すぐにページに反映されるわけではありません。さらに承認して表示させることもないので(HTTP エラーになっていないというだけで)実際に投稿が成功しているかは業者側にはわからないはずなのですが、それでも複数の業者がコメント投稿欄の <form> タグを倣って POST してきています。仕事が不確実というか、質より量というか、だめもとで投稿してきているのが透けて見えるのが嫌な感じです。
それでもブログを書いていると、どれだけ見られているか、どれだけ検索エンジンや他サイトから見にきてくれたか、そして記事への反応などが見えると嬉しいものです。
なのでブログ管理者のコメントスパムへの対応時間をできる限り少なくしていくというのは、変わらず方向性としてあります。今回の対応がどの程度効果があるかはしばらく運用してみないとわからないとは思いますが、経過を見守りつつ、コメントスパムの投稿自体を防ぐことに加え、投稿されたコメントスパムをいかに効率的に選りわけるかにも重点を置いて改善していければと思います。
chocolablog 開発 コメント (0) 2013/05/02 22:30:51