一失足成千古恨是什么意思| 中药不能和什么一起吃| 媱字五行属什么| 鸡肉和什么菜搭配最好| 小孩发烧挂什么科| 无创是什么| 夜里睡觉手麻是什么原因| 本科一批和本科二批有什么区别| 指甲紫色是什么原因| 下焦湿热是什么意思| 属猴的本命佛是什么佛| 口腔黏膜挂什么科| 抗生素是什么药| 经常玩手机有什么危害| 耳朵响吃什么药| 87年兔是什么命| 眼白浑浊是什么原因| 扑救带电火灾应选用什么灭火器| 4月份是什么星座| 总咳嗽是什么原因| 什么时候洗头最好| 什么鱼有毒| 吃芒果有什么好处和坏处| 橘红是什么东西| 增强记忆力吃什么| 什么辣椒不辣| 调侃是什么意思| 复刻是什么意思| 什么原因导致有幽门杆菌| 雌二醇过高是什么原因| 1968年属什么生肖| 软骨瘤是什么病| 皮脂腺囊肿是什么原因引起的| 宫颈机能不全是什么意思| 双子座和什么座最配对| 大肠湿热吃什么中成药| 梅毒长什么样| 急的什么| 白带是什么样子| 梅长苏是什么电视剧| 有口无心是什么意思| 北京大栅栏有什么好玩的| 鱼喜欢什么颜色| kiki是什么意思| 蟑螂喜欢吃什么| 什么情况下要做宫腔镜| 查肝胆胰脾肾挂什么科| 拷贝是什么意思| 人参不能和什么一起吃| 自我价值是什么意思| 雌激素分泌过多是什么原因引起的| 手指没有月牙是什么原因| 介怀是什么意思| 为什么睡觉总是做梦| 乙肝五项一五阳性什么意思| 水母吃什么食物| 女生不来大姨妈是什么原因| 小揪揪什么意思| 吃什么不便秘可以通便| cross是什么牌子| 心血虚吃什么中成药| 怀孕14天有什么症状| 5到7点是什么时辰| 什么是垃圾食品| 1996年出生属什么| 最好的大学是什么大学| 球鞋ep是什么意思| 胆囊炎有什么症状| 爱豆是什么| 老友记是什么意思| 阶段是什么意思| 钟乳石是什么| 硬度不够吃什么中成药| 鼻炎有什么症状| 什么叫肺大泡| 一周不排便是什么原因| 梦见蜜蜂是什么预兆| 舌苔黄厚是什么原因| 左侧上颌窦炎症是什么意思| 什么病会导致不来月经| 胸腺瘤是什么病| 女大一抱金鸡是什么意思| 什么动物吃蚂蚁| 心跳过缓吃什么药| 两弹一星指什么| 可谓是什么意思| 康复治疗学主要学什么| 等闲识得东风面下一句是什么| 塔罗牌是什么意思| 高三吃什么补脑抗疲劳| 什么叫五音不全| 提防是什么意思| 七个星期五什么档次| 游坦之练的什么武功| darker是什么意思| 鹊桥是什么意思| 梦游为什么不能叫醒| 侃侃而谈什么意思| 天天吃玉米有什么好处和坏处| 瘢痕是什么| 基因突变发生在什么时期| 刺五加配什么药治失眠| 靠腰是什么意思| 为什么大姨妈迟迟不来| 足底筋膜炎什么症状| 眼睛红肿吃什么消炎药| 每个月14号都是什么情人节| 梦见筷子是什么预兆| 小便尿色黄是什么问题| 蛆长什么样| hpv病毒是什么病毒| 03属什么生肖| 1987年出生属什么生肖| 什么叫换手率| 双子座的幸运花是什么| 石敢当是什么意思| 1m是什么意思| 有人的地方就有江湖什么意思| 五行土克什么| 龟头炎用什么药| 脚水肿是什么原因| 2009年出生属什么| 情绪化什么意思| 5年存活率是什么意思| 在干什么| hpv12种高危型阳性是什么意思| hcg低有什么补救的办法| 阳性血是什么意思| 机是什么生肖| 鼻渊是什么意思| 峦读什么| 十一月二十九是什么星座| 黄精有什么作用和功效| 天朝是什么意思| 罗宾尼手表什么档次| 人的本性是什么| 头孢不能和什么药一起吃| 定性和定量是什么意思| 保守治疗是什么意思| 唐氏筛查临界风险是什么意思| 89年五行属什么| 口舌生疮是什么原因| 册那什么意思| 说辞是什么意思| 黄柏胶囊主要治什么病| 呼吸快是什么原因| 伽蓝菩萨保佑什么| 李隆基是李世民的什么人| 韩字五行属什么| 什么是电解质饮料| 十二月十四日是什么星座| 小孩自闭症有什么表现| yuki是什么意思| 吉尼斯是什么意思| 物色是什么意思| 蛋白粉有什么功效| 葫芦炒什么好吃| 7月15日是什么星座| 血清铁低是什么原因| 思伤脾是什么意思| 例假不能吃什么水果| 李健是清华什么专业| hc是什么| 小孩睡觉磨牙是什么原因引起的| 10mg是什么意思| 观音坐莲是什么姿势| 摧枯拉朽什么意思| 等着我为什么停播了| 手发痒是什么原因| 身上长扁平疣是什么原因| 下夜班是什么意思| 行房时硬度不够是什么原因| 青津果的功效是什么| 结石吃什么药| 什么是hpv感染| 医保卡有什么用| 梦见被追杀预示什么| 531是什么意思| 吃鱼肝油有什么好处| 辛弃疾字什么| mcn是什么意思| 人中深浅代表什么| 来例假头晕是什么原因| 流产有什么症状或感觉| 手足口病吃什么食物| 宁静致远什么意思| 血糖高喝什么牛奶好| 一直以来是什么意思| r表示什么| 科普一下是什么意思| 前胸后背长痘痘是什么原因| 包租婆是什么意思| 什么是童话故事| 王字旁的字有什么| kako是什么牌子| 打鸡血是什么意思| 梦见剪头发预示什么| jones是什么意思| 正觉是什么意思| 月经期间可以喝什么茶| 你为什么不快乐| 来大姨妈前有什么症状| 地藏王菩萨保佑什么| 肝内高回声什么意思| 鼻子冒热气是什么原因| 468是什么意思| dunhill是什么品牌| 半夜12点是什么时辰| 额头冒痘是什么原因| 男人送女人项链代表什么| 嘴唇发白是什么原因引起的| 红顶商人是什么意思| 你本来就很美是什么广告| 沙发客是什么意思| 血清铁蛋白低说明什么| 女生右手中指戴戒指什么意思| 滇是什么意思| 1215是什么星座| 血压高吃什么水果好| 6月30日是什么座| 胃痛吃什么好| 水肿是什么症状| 什么是柏拉图式的爱情| 一什么树叶| 命里缺什么怎么看| ca是什么意思| 啃手指甲是什么毛病| 慷他人之慨什么意思| 梦见蛇咬我是什么意思| 牙掉了是什么预兆| 伤口消毒用什么好| 藏族信仰什么教| 什么病不能喝酒| 林彪为什么要叛逃| 月经量少要吃什么调理| 被蚊子咬了涂什么| 月经期间同房有什么危害| 买房要看什么| 甲状腺做什么检查| 梦见带小孩是什么意思| 离家出走需要准备什么| 气管炎吃什么药| 跳蛛吃什么| 平平仄仄是什么意思| 芥末油是什么提炼出来的| 象牙白适合什么肤色| 10月30日是什么星座| 蓝莓是什么季节的水果| 环磷酰胺是什么药| 脱肛是什么样子的| 什么的火焰| 小孩老是咬手指甲是什么原因| 985什么意思| 运是什么结构| 为什么会便血| 牛肉和什么炒最好吃| 轻微食物中毒吃什么药| 肾结石是什么原因引起的| 金色配什么颜色好看| 梦见老板是什么意思| 出生医学证明有什么用| 味甘是什么意思| bbq是什么| 蚂蚁上树是什么菜| 百度コンテンツにスキップ

政能亮改革开放,须“同向用力”

提供: Wikisource
DjVuファイル
このページでは、DjVu形式のファイルを作成し、使用し、アップロードする方法を説明しています。DjVuファイルはスキャン画像を1つのコンテナ形式にグループ化しています。

画像の抽出

[編集]
ショートカット:
[{{Fullurl:%5B%5BH%3ADJVUIMG%5D%5D|redirect=no}} H:DJVUIMG]
インターネット?アーカイブからの、DjVu由来の画像(左上)と"Read online"の画像(右下)との比較。ぼやけ、ブロック化、細部の欠落など甚大な品質低下が明白です。しかし、この理由は明らかではありません。というのも、原作者がDjVu版を作成した方法を説明していないからです。
同じGoogle Bookスキャンからインターネット?アーカイブを経由した、DjVu由来の画像(左)とPDF由来の画像(右)の比較。DjVu版では圧縮によって非常にひどいダメージを受けています。しかし、この理由は明らかではありません。というのも、原作者がDjVu版を作成した方法を説明していないからです。
百度 从世界多极化、经济全球化,到文化多样化、社会信息化,我们的地球村越来越成为你中有我、我中有你的命运共同体。

必要な画像を直接DjVuファイルから取り出せれば魅力的ですが、一部のDjVu文書は非可逆圧縮で作成されているため、常に正しい方法とは限りません。画像に不満がなくほかに情報源がないときは、DjVuファイルから抽出してコモンズ上のファイルに{{bad extraction}}タグをつけてください。そうでない場合は、JPG/PNG/TIFFによる文章のスキャンのような、よりよい情報源を使用してください。

DjVuがインターネット?アーカイブから入手したものであれば、オンライン上で閲覧可能な高画質JPGファイルが存在することが多いです(IA details pageにアクセスし、"read online" を選択し、and from there you can increase the size of the image、右クリックして画像を保存してください。

DjVuファイルがGoogle Booksスキャンから作成されている場合、たいていの場合DjVuファイルがPDFに由来していてさらなる圧縮ダメージを招いているため、Goole BooksのPDF文章を活用できます。多くのGoogle Booksスキャンは非常に低画質の2色画像で、他資料のスキャン(IAにおいて"uoft"や"ala"のような接尾辞でカラー?プレビュー画像を探してください)が画像抽出に適しています。さらに、Google Booksスキャンは画像が欠落していたり、ほとんど役に立たない、サムネイル品質の画像が埋め込まれていたり、ページが破れていたり、ページが折れていたりすることが多く、スキャナー操作者がページを押さえる手指が写っていたりする可能性があります。左図は良品質のGoogleスキャンで、つづくDjVu変換による甚大なダメージがみられます。

変換

[編集]

画像からDjVu

[編集]

Windows

[編集]

DjvuToyはさまざまな機能を提供するソフトウェアです:

  • Djvuの作成
  • Djvuファイルの結合
  • Djvuファイルの分割
  • Djvuファイルの編集
  • バンドルされたファイルの作成
  • DjVuから他ファイルへのエクスポート
  • DjVuからのテキストの抽出
  • DjVuファイルの構造情報のダウンロード(例:OCR座標)
画像 → バーチャル?プリンター → DjVu
[編集]

ページ?スキャンが、たとえばGoogle Bookスキャンのような、PDFファイルとして利用可能になっていれば、直接DjVuファイルに変換できます。以下のいずれかを利用してください。

  • The free Any2DjVu online service; this can also OCR the text and embed it in the .djvu file.
  • The freeware Pdf To Djvu GUI. Note that this requires the installation of the Cygwin environment as a prerequisite to its own installation.
  • The freeware command-line tool with GUI for Windows is the Djvu-Spec Pdf 2 Djvu Converter from the djvu-spec.narod.ru software page. This tool offers many settings to change the quality and size of the resulting djvu file.
  • The free software command-line pdf2djvu (available in repositories, also for Linux), which is usually as simple as pdf2djvu -o output.djvu input.pdf. There's also a GUI available.
  • If you need to crop the PDF document, you can use pdfcrop.pl (see below) for black margins or freeware Govert's PDF Cropper for white margins (it requires Ghostscript and .Net 2.0).

If the scanned images are made available as individual images, then the easiest option is to print them to a PDF document via one of the many "virtual printer" tools, such as the free PDFCreator; then convert the PDF document to DjVu as described above.

Note that there are many other options for converting pages to .djvu. One could convert using PostScript or multipage TIFF as the intermediate format, rather than PDF, but this would of course require different conversion tools. It is also possible to convert from .pdf or .ps to .djvu with the DjVuLibre software and its GSDjVu plug-in but due to licensing restrictions installing the plug-in is a fairly intricate process that involves compiling a patched version of Ghostscript.

Another free Windows tool that can come in handy for the images-to-pdf-to-djvu process is ConcatPDF, a GUI tool that permits easy splitting and merging of PDF files. This tool can also be used online. An example of how ConcatPDF might be used is: if a 100-page document has previously been scanned and converted to .djvu and the single page #42 needs to be re-scanned, ConcatPDF would allow that one page to be inserted into the intermediate .pdf file without tracking down the other page images and re-composing the entire document. Installing ConcatPDF version 1.1 requires as prerequisites that the free Microsoft program libraries Microsoft .NET Framework Version 1 and the corresponding Visual J# .NET Redistributable Package be installed beforehand.

画像から直接DjVu
[編集]

しかし、はるかに高画質な文章はDjVuLibreソフトウェアライブラリーを使用することで実現できます。c44エンコーダーを使用することでJPEGファイルを直接個々のDjVuページにエンコードできます。PNGのような可逆圧縮形式の画像はPPM(カラースキャン用)かPGM(グレイスケール用)に変換してからc44を使用すべきです。ほとんどのページ?テキスト画像のような2色(すなわち白黒)スキャンについては、ページ画像をモノクロPBMフォーマットに変換してからcjb2エンコーダーを使用してDjVuにエンコードすることで、より小さなDjVuファイルを得られます。これらの画像形式変換はすべてフリーウェアのImageMagickライブラリーによって実行できます(バッチ上で、mogrifyを使用して)。個々のDjVuファイルはdjvmプログラムを使うことで複数ページのDjVuに統合できます;このプログラムはDjVuファイルにページを挿入したり削除したりすることもできます。

この工程の警告として、高画質スキャンによってより大きなファイルになってしまう可能性があり、現時点でのコモンズへのアップロード制限は100MBです。大きさはdidjvuおよび/またはminidjvuを使って前景?背景分割を適用することで実質的に減少できます。

djVuLibreのスクリプト化
[編集]

このスクリプトを使えば、画像ファイル(JPG、PNG、GIF、TIFF、およびImagemagickがPPMに変換可能なあらゆるファイル)の全ディレクトリを選択し、自動的にDjVuファイルに変換してcollateします。現在はこのスクリプトはWindows用ですが、簡単にLinux用に変換できます。使用にはPython、Imagemagick、およびDjvuLibreが必要になるでしょう。

Linux

[編集]
See also: User:GrafZahl/How to digitalise works for Wikisource
Method 0 - converting graphic files with foreground/background separation
[編集]

Just use didjvu.

You may consider preprocessing the scans with Scan Tailor.

Method 1 - page at a time with DjVuLibre
[編集]

You need the djvu software, which includes a viewer, and some tools for creating and handling DJVU files. You will probably also need the Imagemagick software for converting scans from one format to another:

  • The tool cjb2 is used to create a DJVU file from (bitonal) PBM or TIFF file.
  • The tool c44 is used to create a DJVU file a PNM or JPEG files. This handles colour images, but the compression is lower.

Therefore you need to convert your scans if they are not already in one of these formats.

Conversion to intermediate format
[編集]
  • Conversion from PNG format to PBM format with the tool convert from Imagemagick
convert rig_veda-000.png rig_veda-000.pbm
  • Depending on the quality of the original scans, you may find it useful to process them with the unpaper utility, which deletes black borders around the pages and aligns the scanned text squarely on the page. Unpaper is also capable of extracting two separate page images where facing pages of a book have been scanned into a single image. Another utility is mkbitmap, another pdfcrop.pl (Perl-based and free software, it requires Ghostscript and texlive-extra-utils on Ubuntu; it uses BoundingBox; it can crop a whole multipage PDF document in just one passage). PDFCrop (another one!) deletes white margins.
Conversion to DJVU page file
[編集]
  • Creation of a DJVU file from a PBM file
cjb2 -clean rig_veda-000.pbm rig_veda-000.djvu
  • Creation of a DJVU file from a JPEG file at a given resolution:
c44 -dpi 300 p100.jpg p100.djvu
Creating final DJVU document
[編集]
  • Adding the DJVU file to the final document
djvm -i rig_veda.djvu rig_veda-000.djvu

You need to repeat these steps with a script for each page of the book. Example:

#!/bin/bash
for n in `seq 1 9`
do
        i="rig_veda-$n.png"
        j=`basename $i .png`
        convert $i $j.pbm
        cjb2 -clean $j.pbm $j.djvu
        djvm -i rig_veda.djvu $j.djvu
done

There is also another way to add all the *.djvu parts into one:

djvm -c rig_veda.djvu rig_veda-000.djvu rig_veda-001.djvu rig_veda-002.djvu

See the following section for an automated process for multiple pages.

Method 2 - PDF to DjVu bash script
[編集]

Use this script, which converts a PDF document (multiple or single page) into images, automatically crops them with ImageMagick, converts them in DjVu and bundles them. This is very slow (a large PDF document can require days) but a little more efficient than the following method.

The resulting DjVu document is quite big and low-quality, probably because of poor font recognition, which may be fixed by newer versions of poppler (the used library): the version available in repositories is usually several months old.[1]

You can also remove the pdftoppm part and use the script to convert multiple images directly in a multiple page PDF document. If images are not in pbm format, you can convert them with a single command using mogrify from ImageMagick.

Method 3 - pdf2djvu
[編集]

Simply download the pdf2djvu tool from your repository to directly convert PDF document (single or multiple pages) into DjVu.

If the document contains the results of OCR (as is the case e.g. with FineReader output) then they are preserved in the DjVu document as the hidden text layer. Some other properties of the source document, including metadata, are also preserved. The quality and the size of the output depends primarily on the features of the source document but can also be controlled with several program parameters, such the resolution of foreground and background. The program is capable to use several threads to speed up the conversion.

The original author of this page made the following recommendation which does not seem valid:

Moreover, you need to crop directly the pdf before the conversion. On Linux this is quite difficult. You could use ImageMagick convert -crop, but attention: with multiple page big PDF document, this can take several GB of memory (the limit is 16 TB!) and kill your computer if you don't use the -limit area 1 option directly after -crop. This make the convertion very long.

The resulting PDF document is increased in size and reduced in quality because of rastering.[2]

See other crop tools above.

Method 4 - DjVuDigital
[編集]

Use djvudigital,[3] which like pdf2djvu converts pdf directly in DjVu.[4] There are licensing problems, because the GSDjVu library has a different license, then you'll need to compile it by yourself; the included utils make this step quite easy, but still long (about 1 hour) and a bit annoying.[5]

But, then you can convert PDF document into DjVu with a single command (see the previous section for crop). The conversion is slow (I find it will complete a 300 page PDF document in about 30-40 minutes). The resulting DjVu is of higher quality and lower file size compared to both the previous two methods.[1] Additionally, DjVuDigital can handle JPEG2000 (aka JPX) files embedded in PDF documents, which is a feature of many Google books. pdf2djvu, Any2Djvu and Internet Archive conversions all fail to convert these files, leaving blank pages in the output.

DjVuDigital has many advanced options to improve results, but they can be difficult to master.[6] In general, altering the --dpi option can give you a quick reduction in file size without too much fiddling.

オンライン([ほとんど]すべてのシステム)

[編集]
Any2Djvu
[編集]

画像をDjVuで変換するもう1つの方法は、画像をZIP化してAny2Djvuのサイトを利用して、DjVuファイルを作成する方法です。Any2DjvuはZIP内から画像を抽出し、OCR化したDjVuを作成します。OCR機能は英語のみの対応です。

Any2Djvuでは巨大ファイルは扱えません。大きなファイルはURLでアップロードする(例:ftp://ftp.bnf.fr/005/N0051165_PDF_1_-1DM.pdf などのリンクを入力することで)のが最善です。変換には数時間かかる可能性があります。Any2DjVuはメモリ不足により失敗することがときどきあります。Google Booksスキャンで共通するPDF文書に埋め込まれた"JPX"画像も変換できません。

インターネット?アーカイブ
[編集]

もう1つの方法は、PDF文書(または画像ファイルのアーカイブ)をInternet Archiveにアップロードする方法です。

(注意:2019年3月現在、仕様の改訂によりDjVuファイルは生成されなくなっています。代わりにPDF WITH TEXTをダウンロードし、Wikimedia CommonsにPDFファイルとして直接アップロードすることにより、OCRテキストを利用することができます。)

ログインする必要があります(OpenIdは使わないでください、機能しません[7])。

アップロード
[編集]

右上角の"Upload"をクリックしてください。Flashのアップロード(標準の"Share"ボタン)はFirefoxでは機能しません(代わりにOperaやInternet Explorer[8]またはLinuxを使用してください)。標準の非Flash方式も使えます(ただしFirefoxではファイルの大きさ制限が2GBまでになります。Chromiumではありません。);FTPアップロードは、遅くクラッシュの傾向があるため推奨しませんが、but is the only easy to learn possibility if you have to upload many files (which shouldn't be the case here).

OCRのワナ
[編集]

アップロードが完了すると、インターネット?アーカイブが派生作業を始めます:アップロードしたPDFファイル上の検知された文章のXML文章を作成するOCR、およびテキストが埋め込まれたDjVuファイル、単なるテキストだけのダンプ?ファイルなどへの変換[9]

派生(派生すべきものがあればアップロード後自動的に作動します)を始める前にメタデータを正しい言語に設定することを忘れないでください、そうでなければOCR言語が英語に設定され、他言語の作品の結果がひどくなります。複数のOCR言語を設定するのも不可能ではありませんが、同じ本を2回アップロードして別々の言語を設定してOCRを2回行うことがすすめられます[10]。 処理時間の長さはファイルの大きさと複雑さ、さらに現在のインターネット?アーカイブの変換テストのバックログに依存します[11]キュー内の進行はこちらで、提出した作業に関するより詳細な情報はこちらで確認できます(ログインが必須)

インターネット?アーカイブはプロフェッショナル用で商用でプロプライエタリのソフトウェアABBYY[12]を使用しており、かなり高画質の画像と多くの言語およびフォントのOCRと強力な圧縮[13]とによって高品質の最終版DjVuファイルが維持されます[1]。しかし、インターネット?アーカイブはときどき低画質の過圧縮DjVuファイルを作成します。こうなってしまったら、PDF文書をダウンロードして手動で変換できることが多いです。派生が対象する解像度に減少させることができます。通常はいくらかの「推測」によって自動的に設定されます。設定にはfixed-ppi欄を使い、300dpi以下に設定すると、大きさ、処理時間、および(ときには)エラーが減少します。

画像フォーマット
[編集]

複数のTIFF、JPG、JP2形式の画像(他形式は受け付けません)に分割されたブック?スキャンも適切にTARまたはZIP形式のアーカイブを作成すれば、変換(「派生」)されます[14]。ふつうは未圧縮のスキャンかJPEGをアップロードするほうがいいです;派生工程で作成されるjp2ファイルは、多大の労力がないと操作できないような形で圧縮されます。

トラブルシューティング
[編集]

派生工程で深刻な問題があり、管理者の介入が必要な場合(あなたのタスク?リストで赤になっているもの)、infoarchive.orgで助けを求めてください。ふつうはすごく親切です。ただし、一般的なヘルプのリクエストはフォーラムに投稿してください。何でもないことで手を煩わせないでください!


DjVuからテキスト

[編集]

Any2DjVuによるOCR

[編集]

無料変換サービスAny2DjVuで利用可能なOCRオプションは、スキャン画像にOCRを実行しますが、その結果のテキストは.djvuファイル自体に埋め込まれるため、ウィキソースで利用できるように抽出しなければなりません。

これをする方法の1つはソフトウェアDjVuLibreを使用してテキストを抽出することで、以下のようなコマンドを実行します

djvused myfile.djvu -e 'print-pure-txt' > myfile.txt

または

 djvutxt myfile.djvu > myfile-ocr.txt 

JVbotはDjVuのテキスト?レイヤーをウィキソースのページに自動でアップロードすることができます。たとえば、Robert the Bruce and the struggle for Scottish independence - 1909

インターネット?アーカイブによるOCR

[編集]

上記参照:DjVuファイルをアップロードしたら派生工程がOCRを実行します。

TesseractによるOCR

[編集]

OCRは無料のOCRソフトでスクリプトのTesseractで実行できます:

Tesseract 3.xやその他無料OCRエンジンによるOCR

[編集]

ocrodjvuを使用してください。

DjVuから画像

[編集]

Linux

[編集]

DjVuファイルから画像を抽出するにはddjvuを使います

ddjvu -page=8 -format=tiff myfile.djvu myfile.tif

全ページが終わったら、(-page=**なしで)ページがまとまったTIFFを複数の単一ページのPNG(あるいは任意の他の形式)に分割できます

convert -limit area 1 myfile.tif myfile.png

全ページを80%品質のTIFFに変換できます

ddjvu -format=tiff -eachpage -quality=80 myfile.djvu myfile-%03d.tiff

操作

[編集]

DjVuを生成するために使うDjVuファイルや画像を操作する際のアドバイスです:

DjVuファイルの分割

[編集]

DjVu文書は2とおりの選択肢があります:バンドルと非バンドル(間接)です;後者のフォーマットでは各ページを別々のファイルに保存します。以下のコメントはバンドル版のみを対象にしています。

大きな作品はウィキメディアのサーバーにアップロードできません。制限は100MBになります。DjVuを分割するためにはDjVuLibreの"Save as"を使用しページ範囲を指定して、アップロードできるような小ささのファイルを作成してください。試行錯誤が必要になるかもしれません。

コマンドラインからDjVuファイルを分割するためのもっとも簡単な方法はdjvmcvtを使うことです。

 mkdir mydoc/ &&
 djvmcvt -i 'mydoc.djvu' 'mydoc/' 'new-mydoc-index.djvu'

また、djvusedがコマンドラインから使用できます:

 djvused myfile.djvu -e 'select 10; save-page-with p10.djvu'

これは各ページで使用できます。ページ番号を知るには:

 djvused myfile.djvu -e 'n'

著作権存続中のページの除去

[編集]

archive.orgやその他のサイトで利用可能な作成ずみのDjVuファイルの多くは、Googleの著作権ページが文章の表紙にあります。前提となる法令の分析に基づいたウィキメディアの方針では、たんにパブリック?ドメイン作品をスキャンもしくはコピーし、または主題を忠実に代表する平面写真を撮影したことをもって、著作権がパブリック?ドメインであるとは認められません。スキャン芸術作品、およびウィキメディア財団の見解に関するさらなる詳細は、ウィキメディア?コモンズでご確認ください。

かかる著作権存続中のページやその他無関係な素材はDjVuLibreで除去できます。DjVuLibreはオープン?ソース?プログラムで、DjVuの開発者により、GNUパブリック?ライセンスのもと保守されています。バイナリはWindows、Mac、Linux、Solaris、およびIRIXで利用可能です。djvm.exeが含まれており、コマンド?ライン?ユーティリティーとして実行できます。If you cannot figure out how to do this, you can message Mkoyle (talk), and he will do it for your file and email the file to you for upload. 1ページめ(1)を削除(-d)するためのコマンドラインは以下のとおりです:

djvm -d filename.djvu 1

ある特定のページの表示

[編集]

[[Image:...]]のリンク?タグは"page"引数を受け入れるため、たとえば以下のウィキ?コードはEmily Dickinson Poems (1890).djvuの右側164ページを、幅150ピクセルで表示します(文章なしのうら表紙):

[[Image:Emily Dickinson Poems (1890).djvu|right|150px|page=164]]



The page image can be displayed in the DjVu in place of text as in en:Page:Personal Recollections of Joan of Arc.djvu/9 using:

{{use page image|caption=JOAN'S VISION}}


en:Personal Recollections of Joan of Arc/Book I/Chapter 2のようにページ画像をウィキソースのMain名前空間内に表示するには以下のようにします:

[[Image:Personal_Recollections_of_Joan_of_Arc.djvu|page=27|right|thumbnail|200px|THE FAIRY TREE]]

脚注

[編集]
  1. 1.0 1.1 1.2 例: これは1691 book from GallicaのPDF文書で205MBあります。pdf2djvu.shスクリプトで変換するとほとんど読めない382.4MBのDjVu、djvudigitalでは少し読みやすくなった316.7MBのDjVu、そしてインターネット?アーカイブではより良い品質の51.3 MBのDjVuファイルになります。
  2. For instance, this 55 MB PDF document when cropped with ImageMagick gives a 100 MB PDF document which converted with pdf2djvu gives a 86.2 MB djvu, while the Internet Archive gives directly a 10.1 MB djvu of better quality.
  3. Man page.
  4. A comparison here.
  5. Complete instructions here.
  6. Moreover, they can require the proprietary msepdjvu libray instead of csepdjvu: see superhero pres: is it independently reproducible?.
  7. See forums: Authentication error; not a valid OpenID, Login problems when I click "Share" .
  8. See forum.
  9. もとのPDFにテキスト?レイヤーがないときは、派生工程が、同じく先ほど検知したOCR生成文章を適用することで、自動的に二次のテキスト付きPDFを作成します。

    ですが、PDFがGoogle Booksからのもので、1ページめに免責通知があるときは、派生プロセスが免責ページの隠れたテキスト?レイヤーを検知し、残りのページにも隠れたテキスト?レイヤーがあると想定して、決して作業せず二次PDFファイルの自動作成を完全にスキップすることを、留意してください。免責ページを残すが、すべての隠れたテキストを分離するというのが最適なアプローチです。その理由は、DjVuファイルの謝辞の同時作成と関係があります――分離して空白ページと交換するのも差しつかえありませんし、もちろん最終手段として免責ページを削除することもできます。

  10. See forum.
  11. 例:Vocabolario degli accademici della Crusca, 1691は派生に5.1日かかりました。
  12. 2013年からヴァージョン9.0
  13. たとえば、大きさがdjvudigital出力と比べて1/6になります。
  14. FAQ; documentation of the format to use. 留意点: 拡張子はかならず小文字, tiff は1つ, ppiの値をメタデータに入力. 画像のアーカイブがそのように認識されない場合は, メタデータを編集して形式を"Single Page Processed TIFF ZIP" (TARの場合も) にするなどしてください. おそらくthe _images.zipアーカイブ形式を最初にするべきでしょう.

関連項目

[編集]
dfs是什么 减肥晚上吃什么合适 什么是行政处罚 云南白药植物长什么样 今年三十岁属什么生肖
胆汁是由什么分泌的 白发是什么原因引起的 猫咪能吃什么水果 为什么房间有蟑螂 炖牛肉放什么调料最好
吃炒黑豆有什么好处和坏处 不明觉厉是什么意思 鸡的贵人是什么生肖 个个想出头是什么生肖 双鱼座是什么星象
关节由什么组成 如来佛祖和释迦牟尼是什么关系 糖尿病人能吃什么水果 者加羽念什么 大象喜欢吃什么
心影稍大是什么意思hcv8jop0ns1r.cn 马首是瞻是什么生肖xianpinbao.com md是什么材质hcv9jop0ns7r.cn 吃什么会影响验孕棒检验结果hcv8jop1ns8r.cn 多西环素片主治什么hcv8jop9ns0r.cn
鼠和什么属相最配对hcv8jop9ns8r.cn 纳气是什么意思adwl56.com 牛肉和什么菜炒好吃hcv8jop6ns7r.cn 月经不调吃什么hebeidezhi.com 肠镜活检意味着什么hcv9jop3ns4r.cn
长痘要忌口什么东西hcv7jop7ns2r.cn 陈酿是什么意思hcv9jop2ns1r.cn 什么时候闰三月wzqsfys.com 计划生育是什么意思hcv8jop4ns9r.cn 宝贝疙瘩是什么意思bysq.com
男人喜欢女人什么hcv7jop9ns7r.cn 冠状动脉ct检查什么hcv7jop9ns4r.cn 未融资是什么意思wuhaiwuya.com 孕20周做什么检查hcv8jop5ns3r.cn 发狂是什么意思hcv9jop1ns8r.cn
百度