Не удается прочитать pdf-файл
Хочу извлечь все таблицы из pdf-файла. Для этого использую библиотеку tabula
Пользуюсь jupyter-notebook
!pip install tabula-py
!pip install tabula
conda install -c bioconda java-jdk
Команды установки проходят без ошибок. Но когда пытаюсь импортировать модуль, то возникает проблема
from tabula import read_pdf
pdfs = read_pdf('1.pdf', pages='all', multiple_tables=True)
Ошибка
Error from tabula-java:
The operation couldn’t be completed. Unable to locate a Java Runtime.
Please visit http://www.java.com for information on installing Java.
CalledProcessError: Command '['java', '-Djava.awt.headless=true', '-Dfile.encoding=UTF8', '-jar', '/Users/tatan/opt/anaconda3/lib/python3.9/site-packages/tabula/tabula-1.0.5-jar-with-dependencies.jar', '--pages', 'all', '--guess', '--format', 'JSON', '1.pdf']' returned non-zero exit status 1.