Algolia with Javascrpt

全文検索できるよ。あいまい検索やヒットした単語の強調などできて、日本語もOKだったり。

Algolia登録

  1. Algoliaのアカウント作成
  2. New AppligacionからAPPSを作成
    • アプリ名はあとからでも変えられるが、混乱しそうだったらアプリ名を入れるのも可
    • 地域を選んでCONTINUE WITH JAPAN AS MAIN DATA CENTER
    • Dashbordが出てくるが、Community(free) planを使うにはBrand Assetsが必須
  3. algoliaのダッシュボードに戻ってindex(というか判りやすい名前でOK)を作成。先に入っているgetstarted_actorsは消してもいいというか、消さないと混乱するかも?

続きは、JekyllBloggerなどへ。
の予定だったのだが。

サイトからindexを作成

古すぎて(しかも構造がめちゃくちゃ)無理だろうと諦めていたサイトがあるのだが、algolia-webcrawlerなるものを発見。
sitemap.xmlなどを潜って行くタイプなので、ページネーションやら何やらを気にしなくても可能。

  1. (無ければ)Xml Sitemap Generatorなどでsitemap.xmlを作成し、FTPで放り込んでおく
  2. npmでインストール1
    $ npm i algolia-webcrawler -g
    
  3. configファイルを作る2config.jsonのサンプルもある)
  4. 実行
    algolia-webcrawler --config <jsonな設定ファイル>
    

で、あっけなく登録完了。
自分みたいに破綻しまくりなサイト3じゃない限り、これで大丈夫かと。

あ、過去にiso-2022-jpで作ってて、しかもCloudflareを噛ませていると、文字化け地獄になります。

CloudflareのPage RulesでEmail Obfuscation: Offにしたり、見知らぬ言語でpluginsを作ろうとしたりあがいてみましたが、最終的には全部UTF-8な文字コードに変換4し、中途半端に書いてあったcharsetも置換5し、.htaccessにAddDefaultCharset UTF-8を追加しました。

  1. そのうち、Node.jsとかその周辺も書いたほうがいいのかなぁ。 

  2. 自分のは特殊すぎる例なので晒せないです。ヒントとしては、h1などのタグを追加したり、textの方にもタグを追加したりなど、項目は増やせます。 

  3. 昔はtableやblockquoteタグでレイアウトしているのもありましたし… 

  4. コマンドが面倒or苦手なら、Windows的にKanjiTranslatorなどを使ったり。 

  5. 同じく、TextSSを使ったり。って、そもそも古くから携わっている人で「黒い画面」が苦手な人って少ない気がする。 

Updated: