Tag Archive for キーワード

MT4 / タグに関して今までに行ったことのまとめ

今までに実施した事項についてまとめました。
管理が悪いこともありますが、そもそもこんなに大量にブログを書くとは思ってなかったので、将来を見越した設計にはなっていません。正直なところ今後どうなるかも、どうしたいかも明確なビジョンを持っている訳ではなく、ハッキリしないため、カテゴリーをどう使うか? タグをどうするか? 
いまだに決めかねています。(開き直って言えば「こちとら趣味で書いているんだからビジョンなんかあるわけねぇ」・・・です(笑)) どうするにせよ、量の問題があるので、進むだけではなく、失敗だと分かったとき簡単に戻れるようにしておかないと、バカですよねー それだけは考えながら進めたいと思ってます。

■Deliciousのタグを取り込む方法 ※Delicious以外でも同じ方法でできると思います。

  1. DeliciousからタグをXMLダンプ(https://api.del.icio.us/v1/posts/all)
  2. EntryPermalinkをキーにマッチング、EntryIDを算出。
  3. タグはまとめてブログに登録(未公開で可)→mt_tag生成。
  4. Deliciousのタグとmt_tagをマッチングし、tagid算出。
  5. 2と4からmt_objecttagへのInsert SQL生成。

■キーワードをタグに取り込む方法

  1. EntryIDとキーワードをダンプするテンプレート作成。
  2. キーワードをタグに分解。
  3. タグはまとめてブログに登録(未公開で可)→mt_tag生成。
  4. キーワードから取り出したタグとmt_tagをマッチングし、tagid算出。
  5. 2と4からmt_objecttagへのInsert SQL生成。
  6. 取り込んだ内容確認。
  7. キーワードをNULLクリア(NULLでアップデート)。

■今後の課題
いま思っていることは、MT上のタグは、例えば「MANOI PF01」などは、スペースを含んだ形で管理するようにしていますが、現在の主流(Delicious/Yahoo/FC2など)は、「MANOI」「PF01」といった具合にスペースを含まない形で管理しています。(スペースを含めると別のもの「MANOI_PF01」になっちゃったりします。) 前者の方が効率がいいので、いっそのことそちらに移行してしまおうかとも。分解する方はデータベースの操作でできるのでやるのは簡単ですが、これは移行したら元には戻せないので悩むところです。(テーブルのバックアップをとっておくか、使わなくなったキーワード欄に現在のタグを格納しておけばいいのかも知れないですね。)

Movable Type/TypePad のキーワードをタグに移行しました。

MovableType3.3以降、標準でタグ機能が使える様になったようですが、私のブログは元々ココログ(TypePad)で管理していたので、そもそもタグ機能がなく、キーワードと、del.icio.us(今はdeliciousでしたね)などソーシャルブックマークを使ってタグの管理をしてました。

deliciousで管理していたタグはスクリプトを作って、全部MovableTypeに統合してしまったので、今度は、ココログ(TypePad)からそのまま持ってきたキーワードを統合することにしました。

■手順

  1. 簡単なテンプレートを作って、ダンプしました。後でデータベース更新するためにEntryIDもダンプしてます。
    <MTEntries lastn=”9999″>
    <$mt:EntryID$>,@@@@,<$MTEntryKeywords$> 
    </MTEntries>
    ※@@@@は特に意味がありませんが、他の文字と紛れてしまわないようにマーカー的意味合いで入れてます。
  2. きちんとしたルールでキーワードが書き込まれていれば、これを分解するのも容易ですが、区切りが色々だったののちょっとだけ苦労しました。最終的には、
    EntryID,キーワード(併記していたものを1つ1つ展開したもの) 
    ・・・全部で2000行ほどできました。
    と、キーワードのみを「,」で区切ったもの(全部まとめて1行にする)
    ・・・の2つを作りました。
  3. キーワードのみ「,」区切りを新しいブログ記事のタグにコピペで入力し、未公開状態で登録しました。
  4. mt_tagをダンプ(使うのは、tag_idとtag_name)しました。
  5. 3のあとデータベースより、4をすると2の最初のファイルと全部マッチする状態になります。ここで全ての行にtag_idを割り当てて、mt_objecttagにインサートすれば、取り敢えずはできあがりです。
  6. ただこの状態だと重複やキーワードの使い方の揺れ(不統一)などもありますので、mt_objecttagとmt_tagをJOINして、tag_name付きのmt_objecttagを作成し、tag_nameでソートすれば、どれを削除し、どれとタグの使い方を統合すべきか、割と分かりやすくなります。私は、ExcelファイルでExportして、Excel上で直しました。直した上で、それぞれUPDATEやDELETEすれば、割ときれいになります。
  7. 以上を行い確認した上で、mt_entryにあるキーワードはNULLクリア(update)しました。

まだ少し、色々ありますが、初期の状態よりは、だいぶよくなってきています。
空けたキーワードのフィールドは、別の用途で使おうかと思ってます。(例えばアクセス数をバッチで入れたりとか。)

ヤホーで調べないで下さい(笑)




画像提供&リンク先:Amazon
笑魂シリーズ ナイツ 「ナイツのヤホーで調べました」 [DVD]
検索エンジンは個人の好みもあるので、私がとやかく言う問題ではないのですが、Yahoo!で検索してここに来て頂いている皆さんは、恐らく目的の記事を見つけられず、ガッカリして帰っていかれているのではないかと思います。というのは、ログを見ているとキーワードの内容を見ると “本当はあるのに” と思うものが全く別の記事にリンクされてしまっているからです。原因は色々あると思うのですが、サイドバーやカテゴリーの情報を検索ノイズとして拾ってしまうこのブログ自身の問題と、クロールのインターバルが長かったり、あるいは拾わなかったりするYahoo!の問題の両方があると思ってます。
「使わないで下さい/調べないで下さい」とは言いませんが、「お帰りになる前にGoogleでもう1度調べてみて下さい。」と言いたいです。
たぶんその記事 ありますから。


Google








WWW を検索  
このサイト内を検索