Скармливаем в ChatGPT большой PDF-документ и даем по нему запросы

• Нет отзывов

Автор

Описание

Вы можете объединить ChatGPT  с многостраничными PDF документами, используя GPT-4, LangChain, Pinecone, Typescript, Openai и Next.js. Чат-бот поможет вам быстро изучить большие объемы PDF-документов, выдав краткое описание. Так же поможет разобраться с большим и непонятным списком литературы создав ссылки на статьи, используемые для создания документа. И ответит почти на все ваши вопросы касающегося изучаемого файла.

Пример использования: Устанавливаем, заходим в появившейся веб интерфейс chatGPT, скармливаем ему книгу “Война и мир”, и просим написать краткое содержание книги

Для создания чат-бота используется новый API-интерфейс GPT-4, а также стек технологий включающий: LangChain (это платформа, упрощающая создание масштабируемых приложений AI/LLM и чат-ботов), Pinecone (это векторное хранилище для хранения вложений и PDF-файлов в текстовом виде для последующего извлечения аналогичных документов.), Typescript, Openai и Next.js.

Визуальное руководство по этому репозиторию находится в “visual guide” папке.

Установка

1. Копируем репозиторий

git clone [github https url]

2.Установите пакеты

pnpm install

3.Настройте свой “.env” файл

  • Копия “.env.example” в “.env”     Ваш “.env” файл должен выглядеть так:

OPENAI_API_KEY=

 

PINECONE_API_KEY=

PINECONE_ENVIRONMENT=

 

  • Зайдите на openai , чтобы получить ключи API, затем вставьте их в свой “.env” файл.
  • Зайдите на  pinecone , чтобы создать и получить ключи API.

4. В “config” папке замените “PINECONE_INDEX_NAME” и “PINECONE_NAME_SPACE” своими данными из панели управления pinecone.

5. В “utils/makechain.ts” цепочке измените “QA_PROMPT” для своего собственного варианта использования. Измените “modelName” в “new OpenAIChat” для другой API модели, если у вас нет доступа к gpt-4. См. документы OpenAI для уточнения списка поддерживаемых “modelNames”. К примеру, вы можете использовать gpt-3.5-turbo, если у вас еще нет доступа к gpt-4.

Преобразуйте свои PDF документ для эксплуатации

  • В “docs” папке замените pdf своим собственным pdf документом.
  • В “scripts/ingest-data.ts” поместите “filePath” с “docs/{yourdocname}.pdf”
  • Запустите скрипт

pnpm run ingest

чтобы «проглотить» и встроить свои документы.

  • Проверьте панель управления Pinecone, чтобы убедиться, что ваше место для названия  и векторы добавлены.

Запустите приложение

После того, как вы убедились, что вложения и контент были успешно добавлены в ваш Pinecone, вы можете запустить приложение

pnpm run dev

чтобы запустить локальную среду разработки, а затем ввести вопрос в интерфейсе чата.

 

Вход

Либо введите логин и пароль:

Продолжая, я соглашаюсь с

Пользовательским соглашением,

Политикой конфиденциальности,

Политикой возврата.

Регистрация

Регистрация на сайте возможна только через один из предложенных сервисов:

Продолжая, я соглашаюсь с

Пользовательским соглашением,

Политикой конфиденциальности,

Политикой возврата.

Оплата