Kazuki KyakunoinaxincQwen2-VL : ローカルで動作するVision Language Modelローカルで動作するVision Language ModelであるQwen2-VLのご紹介です。Qwen2-VLを使用することで、ローカル環境で画像に対して質問することが可能です。20h ago20h ago
Kazuki KyakunoinaxincWhipser Large V3 Turbo : 高精度で高速な音声認識モデル高精度で高速な音声認識モデルであるWhipser Large V3 Turboのご紹介です。Oct 9Oct 9
Kazuki KyakunoinaxincFlorence2 : 軽量でエッジ実装可能なVision Language Model軽量でエッジ実装可能なVLMであるFlorence2の紹介です。Oct 7Oct 7
Kazuki Kyakunoinaxincailia LLM : エッジデバイスにLLMを実装できるライブラリエッジデバイスにLLMを実装するためのライブラリであるailia LLMの紹介です。Sep 30Sep 30
Kazuki Kyakunoinaxincailia AI Voiceとailia AI SpeechにPython APIを追加音声合成を行うことができるailia AI Voiceと、音声認識を行うことができるailia AI SpeechにPython APIを追加しました。Sep 25Sep 25
Kazuki KyakunoinaxincSegmentAnyhing2 : 動画に対応した任意物体のセグメンテーションモデル動画に対応した任意物体のセグメンテーションモデルであるSegmentAnything2の紹介です。Aug 27Aug 27
Kazuki KyakunoinaxincLlama3の論文を読む世界最高レベルのLLMであるLlama3の論文には、最新のLLMの研究に関する知見が多く含まれています。本記事では、Llama3の論文で興味深かった点を紹介します。Aug 19Aug 19
Kazuki Kyakunoinaxincai-edge-torchでPytorchからtfliteに変換するai-edge-torchを使用して、Pytorchからダイレクトにtfliteを出力する方法を解説します。Aug 13Aug 13
Kazuki KyakunoinaxincBERT Tokenizer : 英語向けトークナイザBERT Tokenizerは言語処理モデルのBERTで使用されている、英語向けのトークナイザです。Aug 8Aug 8