論文を読もうとして、Abstract で力尽きることがよくあります。
英語の密度が高いし、数式は出てくるし、前提知識がないとどのセクションを読めばいいかもわからない。そういうことが続いていて、「誰かが噛み砕いて説明してくれたらいいのに」という気持ちから作り始めたのが、このツールです。
NotebookLM じゃだめだったの?
最初に試したのは Google の NotebookLM でした。使い勝手はとても良くて、要約や Q&A はかなり便利です。
ただ、論文には数式や図がよく出てきます。NotebookLM の場合、そのあたりは少し薄くなりがちで——どうせ作るなら、数式はテキストアートで表現してもらい、図の内容も文章で丁寧に説明してもらえる形にしたかった。あとは、使い勝手をじぶんの好みに合わせて細かく調整できる余地が欲しかったというのもあります。
そういう「自分用に作りたい」という気持ちで作ったツールです。
できたもの
Paper Reader という Streamlit アプリです。
arXiv の PDF URL(例: https://arxiv.org/pdf/1706.03762.pdf)をサイドバーに貼ると、Claude がセクション構成を自動で検出して、ひとつずつ解説してくれます。
わからなければ質問を打ち込む。理解できたら「次へ」と入力するか「次のセクション▶」ボタンで進む。そのくり返しで最後まで読める、という流れです。
使い方はシンプルで、
- サイドバーに Anthropic の API キーを入れる
- URL か PDF ファイルを読み込む
- あとは先生と対話しながら読み進める
だけです。
生物の知識ゼロで読み切った論文
最初のテストは Transformer の原論文(Attention Is All You Need、2017年)でした。全セクション読み切ったのは初めてかもしれません。
でも、一番「作ってよかった」と思ったのはその次です。
Google DeepMind が 2026年1月に Nature 誌に発表した AlphaGenome という論文を読んだのですが、私は生物学の知識がほぼゼロです。「ゲノム」と「遺伝子」の違いも怪しいくらいのレベルでした。
それでも、先生がちゃんとついてきてくれました。
「非コード変異」という用語が出てきたら、
タンパク質コード領域 = 料理のレシピ本のレシピそのもの
非コード領域 = レシピ本の「この料理はいつ作るか」「何人分作るか」という注釈部分
と例えてくれる。「ゲノムトラック」という聞き慣れない言葉は、DNA の各位置に数値が張り付いている音楽の楽譜のようなもの、と説明してくれる。
途中、「クロマチンアクセシビリティって何ですか」と聞いたら、DNA が「開いて読みやすい状態かどうか」という概念だと教えてもらい、なるほどと思いながら次のセクションへ進めました。
31ページある論文を全部読み切ったのは、ちょっと自分でも驚きました。
技術的な構成
paper_reader/
├── app.py # Streamlit アプリ本体
├── 起動.bat # ダブルクリックで起動(Windows)
└── sessions/ # 対話ログの保存先
使っているライブラリは Streamlit、PyMuPDF、Anthropic SDK の3つです。
セクション自動検出は Claude API に論文の冒頭テキストを渡して、構成を JSON で返してもらう形にしました。ほとんどの論文でそのまま動きますが、変わった構成だとたまに「Page 1, Page 2, …」というフォールバックになります。
解説はストリーミングで表示されます。先生がリアルタイムでタイプしているように見えるので、待ち時間がそれほど気になりません。
会話は「💾 会話を保存」ボタンで Markdown に書き出せます。あとで読み返せるのが地味に便利でした。
手元で動かす
git clone https://github.com/margaret-research/paper-reader.git
cd paper-reader
pip install streamlit pymupdf anthropic requests
streamlit run app.py
Windows は 起動.bat のダブルクリックでも起動できます。
Anthropic の API キーはサイドバーから入力するか、環境変数 ANTHROPIC_API_KEY に設定しておくと自動で読み込まれます。
使ってみて
「先生が画面の中にいる」感じが思った以上によかったです。
読む、質問する、また読む——この流れが自然に続くので、ふだん途中で諦める論文も最後まで読めてしまいます。セクションを飛ばしたいときは目次から直接ジャンプできるので、「ここはわかってるから次」という使い方もできます。
セクション検出の精度や長い論文でのトークン管理あたりにはまだ改善の余地がありますが、日常的に使えるレベルには来ていると思っています。
興味があれば試してみてください。
GitHub: margaret-research/paper-reader
コードは MIT ライセンスで公開しています。