資料庫里的很大部分是pdf格式的,不便于摘抄,復(fù)制,更不方便傳播。
前些時(shí)間在做易經(jīng)類書籍的電子版,感覺集體合作的力量大的很,幾十萬字的書幾天就制作好了。
http://www。37tcm。net/forum/viewthread.php?tid=4564&fpage=1
http://www。37tcm。net/forum/viewthread.php?tid=4038
http://www。37tcm。net/forum/viewthread.php?tid=4532
上面幾個(gè)鏈接里wesleybb、古月等朋友已經(jīng)在做桂林古本
傷寒論的工作
有時(shí)間的朋友,我們可以成立一個(gè)制作小組。把pdf文檔做成文本文檔。
這樣便于傳播,比如一張cdrom就足以容納所有有價(jià)值的內(nèi)容
請(qǐng)大家發(fā)表自己的看法沒有意義,象支持、我頂、不錯(cuò)之類的回帖就免了。
[
Last edited by 魚翔淺底 on 2005/12/10 at 11:20 ]
-----------可以的。你能告訴我制作的方法嗎?
我?guī)浊П緢D書正在等待制作后給大家分享啊。
-----------pdf直接ocr沒做過,我都是自己把書掃描成tif,剛才搜索到一些信息,貼出來供參考
軟件名稱 CajViewer
說明:CAJViewer 6.0全文瀏覽器是中國期刊網(wǎng)的專用全文格式閱讀器截至 2005 年 5 月為止的最新版本,是5.5的升級(jí)版本,修改了一些老版本中存在的問題,如:打印、顯示亂碼,部分KDH文件的瀏覽問題,同時(shí)新增加如下功能:圖書管理功能,支持單頁\連續(xù)頁瀏覽模式、知識(shí)元鏈接、自動(dòng)滾動(dòng),文字編輯功能可將選擇的內(nèi)容發(fā)送到指定的Word文檔,頁面定位更加方便,支持書簽、注釋、高亮、直線,曲線、下劃線,刪除線和自定義知識(shí)元等八種標(biāo)注功能,并有專門的標(biāo)注窗口對(duì)它們進(jìn)行管理,可對(duì)標(biāo)注信息進(jìn)行編輯,方便的書架管理讓您更易于管理書籍,更加強(qiáng)大的搜索功能讓您更加容易查找到感興趣的文本,并且能迅速定位到文檔的相關(guān)位置,友好豐富的幫助功能必定使您更容易掌握這款先進(jìn)的產(chǎn)品。(OCR技術(shù)由清華文通授權(quán)使用)。
http://202.38.232.5/CAJViewer6.0_OCR.msi
使用步驟如下:
1。啟動(dòng)該軟件。
2。打開PDF文件。
3。點(diǎn)擊軟件頂端一排按鈕中的“文字識(shí)別”按鈕。
4。用鼠標(biāo)選定你要OCR的PDF文字的范圍。
5。松開左鍵,等一下,文字結(jié)果就出來了。OCR的效果至少比別的自帶OCR的瀏覽器要好。
不知道管用不
-----------以我的經(jīng)驗(yàn),清華的OCR比不上微軟office2003自帶的OCR,還差不少呢。
-----------我們可以試驗(yàn)一下,哪個(gè)好用用哪個(gè)。多組織幾個(gè)朋友一起來。
鋸響就有末啊
-----------
Originally posted by 魚翔淺底 at 2005/12/11 00:21:
我們可以試驗(yàn)一下,哪個(gè)好用用哪個(gè)。多組織幾個(gè)朋友一起來。
鋸響就有末啊
支持你。應(yīng)該多多的比較一下。
-----------。。。。。。年底了,事情太多。最近俺怕是做不成試驗(yàn)了
-----------
Originally posted by wesleybb at 2005/12/10 17:07:
以我的經(jīng)驗(yàn),清華的OCR比不上微軟office2003自帶的OCR,還差不少呢。
微軟的今天我裝了,怎么識(shí)別不了?
老是跳出如下圖的咚咚!
叫我設(shè)置語言,我設(shè)置不了啊,老是這一個(gè)選項(xiàng)!郁悶!
是不是因?yàn)闆]裝掃描儀的緣故哦?
附件: 你需要登錄才可以下載或查看附件。沒有帳號(hào)?注冊(cè)