Каталог статей


Выбранная схема!!!


7009
Умное стекло, которое может читать книги

Умное стекло, которое может читать книги

efy test sani theoМы видели множество умных очков, которые определяют расстояние между объектами или помогают людям с ослабленным зрением распознавать лица людей. Здесь мы расширяем его до следующего уровня, используя оптическое распознавание символов (OCR). Расширяя проект DIY до следующей версии, мы теперь подробно рассказываем о создании умного стекла, которое может читать текст с помощью оптического распознавания символов и компьютерного зрения. Таким образом, камера, установленная на передней части стекла для оптического распознавания символов и компьютерного зрения, позволит людям с нарушениями зрения также читать. В этой версии вам также понадобятся очки.

Предварительные условия

Во-первых, нам нужно установить некоторые необходимые для проекта модули и библиотеки. Поскольку «умное стекло» основано на обработке видео в реальном времени, с помощью оптического распознавания символов мы можем извлекать текст со страниц, которые могут содержать изображения. Здесь необходим модуль, способный захватывать изображения с камеры. С помощью модуля синтеза речи текст на захваченных изображениях можно преобразовать в речь.

Во-первых, нам необходимо установить следующие библиотеки:

<ул>
  • OpenCV
  • ПиТессеракт
  • eSpeak
  • Чтобы установить их, используйте команды ниже:
    sudo apt-get install espeak
    sudo apt-get install espeak python-espeak
    sudo pip3 install opencv2

    Кодирование

    Импортируйте в код необходимые библиотеки, а затем укажите путь, по которому будут сохраняться видеокадры для извлечения текста.

    Рис. 1. Фрагмент кода, импортирующий модули Python
    Рис. 2. Фрагмент кода для захвата видео и его обработки для оптического распознавания символов
    Рис. 3. Тестирование кода

    Создайте в коде цикл while, который будет захватывать видео с камеры в реальном времени. Используя cv2, преобразуйте изображение в BGR и сохраните его по ранее установленному пути. Затем вызовите PyTesseract, который откроет сохраненный видеокадр для обработки изображения и извлечения из него текста. Используя eSpeak, речевой движок преобразует весь этот текст в аудио и читает его.

    Рис. 4: Авторское устройство с камерой на очках
    Рис. 5. Автор тестирует устройство

    Примечание

    Для четкого вывода голоса, который не будет звучать роботизированно, вы можете использовать платные или другие службы преобразования текста в речь, такие как gtts, Watson Speech и т. д.
    Тестирование

    Закрепите камеру на очках и запустите код. Если положить книгу перед камерой и подождать несколько минут без какого-либо движения, она автоматически начнет читать книгу. Чтобы услышать его, подключите наушники к разъему TRRS для наушников Raspberry Pi или к любому динамику с усилителем. Вы также можете подключить любые наушники Bluetooth.

    <час/>

    Ашвини Кумар Синха — любитель электроники и технический журналист EFYi


    Категория: Динамики | Добавил: Администратор (17.05.2026)
    Просмотров: 7 | Рейтинг: 0.0/0


    Всего комментариев: 0

    Все ссылки на книги и журналы, представлены на этом сайте, исключительно для ознакомления, авторские права на эти публикации принадлежат авторам книг и издательствам журналов! Подробно тут!
    Жалоба

    ьте свои комментарии !!!!

    Имя *:
    Email:
    Код *:

    Copyright Zloy Soft (Company) © 2008 - 2026