超級筆記方式
NotebookLM是Google推出的一個筆記工具,超級好用。目前(2024-09-15)可以上傳很多PDF或貼上網址等,來總結50個以內的資料來源。貓貓猜測應該有使用 Retrieval-Augmented Generation (RAG) 檢索自己上傳的資料來源,來提升輸出的品質。
How does Retrieval-Augmented Generation work?
RAGs operate with a few main steps to help enhance generative AI outputs:
Retrieval and Pre-processing: RAGs leverage powerful search algorithms to query external data, such as web pages, knowledge bases, and databases. Once retrieved, the relevant information undergoes pre-processing, including tokenization, stemming, and removal of stop words.
Generation: The pre-processed retrieved information is then seamlessly incorporated into the pre-trained LLM. This integration enhances the LLM’s context, providing it with a more comprehensive understanding of the topic. This augmented context enables the LLM to generate more precise, informative, and engaging responses.
RAG operates by first retrieving relevant information from a database using a query generated by the LLM. This retrieved information is then integrated into the LLM’s query input, enabling it to generate more accurate and contextually relevant text. RAG leverages vector databases, which store data in a way that facilitates efficient search and retrieval.
目前 NotebookLM 可以做到把資料以對談的語音輸出 (audio overview)。
搜尋資料
當 NotebookLM可以快速的總結出堪用的筆記或討論,那麼收集品質足夠高的資料會是能否充分發揮效果的關鍵。在搜尋關聯的資料方面,貓貓目前知道兩個方式:
- 使用 Connected Papers
免費版每個月有查詢次數限制,而查詢品質還不錯。 - 使用 Research Rabbit
免費的就可以無限查詢,引用的關聯做得比查詢確實。
貓貓比較常用後者。
管理文獻
在查到資料後,可以接著用 Zotero 來管理文獻。使用上簡單方便,就是免費版的空間上限目前只有 300MB。這適合管理書目,但大量的PDF檔案要另外想辦法。
另一個管理PDF檔案的方法是用 Mendeley,目前免費版的空間有 2GB。
結語
目前本貓貓想到:
將一些經典教科書或文章妥善管理,並利用 NotebookLM 快速檢索或總結,應該可以達成超高速學習的關鍵步驟。接下來是一邊教學,一邊打好基礎 (Learning by teaching)。