Skip to content

yeahhe365/InsightPDF

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

InsightPDF

中文 | English

License React Gemini API TypeScript

与 PDF 对话,并“看见”答案在哪里。
基于 Google Gemini 多模态模型构建的智能文档助手,支持精确的视觉定位与边框高亮。

快速体验功能特性本地部署


🚀 在线演示

我们提供了两种方式供您体验:

1. ⚡️ 免费体验版 (无需 API Key)

通过 Google AI Studio 托管,直接使用,无需任何配置。

👉 点击跳转:AI Studio 免费版

2. 🔑 自定义版 (配置自己的 API Key)

如果您有自己的 Google Gemini API Key,可以使用此部署版本。

👉 点击跳转:Web 演示版


✨ 核心功能

InsightPDF 不仅仅是一个聊天机器人,它是一个视觉化的阅读助手:

  • �� 视觉定位 (Visual Grounding) AI 不仅回答问题,还会自动跳转到 PDF 对应页面,并用红框高亮显示答案来源(支持文本段落、图表、数据表格)。
  • 🧠 多模态智能 基于 Gemini 2.0 Flash / Pro 原生多模态能力,无需传统 OCR,直接理解文档的视觉结构。
  • ⚡️ 极速响应 支持流式传输,大文件通过 Files API 优化处理,秒级响应。
  • 🎨 优雅体验
    • 深色模式:自动适配系统或手动切换。
    • 拖拽上传:支持桌面端全屏拖拽。
    • 移动端适配:手机上也能流畅阅读和对话。
  • 🛡️ 隐私优先 聊天记录和设置均存储在浏览器本地(LocalStorage/IndexedDB),只需配置 Key,无需担心数据泄露。

🛠 技术栈

  • 前端框架: React 19 + Vite
  • 语言: TypeScript
  • 样式: Tailwind CSS
  • PDF 渲染: React-PDF
  • AI 模型: Google Gemini API (gemini-2.0-flash, gemini-1.5-pro)

💻 本地开发

如果你想在本地运行该项目:

  1. 克隆仓库

    git clone https://github.com/yeahhe365/InsightPDF.git
    cd InsightPDF
  2. 安装依赖

    npm install
  3. 配置环境 在项目根目录创建 .env.local 文件,填入你的 API Key:

    GEMINI_API_KEY=your_api_key_here

    (或者启动后在网页设置面板中输入)

  4. 启动服务

    npm run dev

    访问 http://localhost:3000 即可使用。


📄 开源协议

MIT License © 2024 yeahhe365

友链

  • Linux.do:也称 L 站,是一个活跃的中文技术社区,围绕 AI、软件开发、资源分享与前沿资讯展开讨论;社区愿景是“新的理想型社区”,社区文化是“真诚、友善、团结、专业,共建你我引以为荣之社区”。

About

与 PDF 对话,并「看见」答案在哪里。基于 Gemini 多模态模型的智能文档助手,支持精确视觉定位与边框高亮。 | Chat with PDFs and "see" where answers are. AI document assistant powered by Gemini multimodal models with precise visual grounding.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors