Scan tài liệu sang PDF cực đơn giản
Scan tài liệu sang PDF cực đơn giản

Scan tài liệu sang PDF cực đơn giản

Thứ Bảy, ngày 07/08/2010 13:00 PM (GMT+7)

Để biến những văn bản, tài liệu trên giấy thành những file lưu vào máy tính cho gọn và dễ tìm, người ta sẽ thực hiện như thế nào: Nhờ một phần mềm nhận dạng ký tự hay quét thành file ảnh? Thực ra, giải pháp khả thi cho công việc số hóa tài liệu này là quét thành những file pdf…

MỜI CÁC BẠN ĐÓN ĐỌC NHỮNG BÀI VIẾT CHỌN LỌC VỀ VI TÍNH INTERNET, THỦ THUẬT VÀO LÚC 7H30, 13H, VÀ 16H CÁC NGÀY TRONG TUẦN, TẠI 24H.COM.VN

Nếu bạn đang lưu trữ khá nhiều tài liệu cũ ở dạng sách, báo, giấy tờ viết tay… và luôn thấp thỏm lo sợ chúng sẽ bị mục nát theo thời gian, cũng như mất nhiều thời gian kiểm tra và bảo quản chúng thì có một cách giúp bạn quẳng đi gánh nặng này với chi phí khoảng chừng 850.000 đồng. Đó là số hóa tất cả những gì có thể bằng một máy quét hình (scanner), hay còn gọi là máy scan, tất nhiên là bạn đã có máy tính.

Scan tài liệu sang PDF cực đơn giản - 1

Chọn máy scan

Hiện nay trên thị trường chỉ có loại máy scan khổ A4 của các nhãn hiệu Genius, HP, Epson. Tuy nhiên, vì mục đích chính là dùng vào việc số hóa tài liệu nên bạn có thể không cần quan tâm đến nhãn hiệu hay độ phân giải tối đa của từng loại máy scan. Do vậy bạn có thể chọn loại máy scan có giá thấp nhất với độ phân giải 1200×2400 dpi, giá chừng 850.000 đồng. Không nên chọn loại máy có chức năng scan phim mà đắt tiền.

Sau đó, kết nối với máy tính bằng cáp USB kèm theo máy rồi cài chính xác driver cho nó. Thông thường, trên các đĩa CD kèm theo máy sẽ có rất nhiều chương trình hỗ trợ scan của nhà sản xuất nhưng bạn chỉ cần cài driver và phần mềm hỗ trợ scan là đủ.

Cài phần mềm scan

Để dễ quản lý và lưu trữ cài tài liệu, bạn nên lưu tài liệu scan được ở dạng file sách điện tử PDF thay vì file hình dạng JPG, mặc dù kích thước file JPG nhỏ hơn khoảng 10% so với file PDF. Nếu phần mềm hỗ trợ scan của nhà sản xuất có chức năng scan tạo file PDF thì bạn không cần phải cài thêm các phần mềm hỗ trợ scan khác. Còn nếu thấy phần mềm này rối rắm, khó dùng và chức năng scan tạo PDF không tối ưu, hoặc không có chức năng scan tạo file PDF, bạn hãy cài thêm phần mềm Softi Scan to PDF (www.softi.co.uk, dùng thử trong 30 ngày) để thực hiện nhanh việc scan tạo file PDF.

Ngoài ra, nếu muốn lưu tài liệu số hóa ở dạng chỉnh sửa được, bạn có thể cài thêm phần mềm VnDOCR của Viện Công nghệ thông tin để scan và nhận dạng tài liệu tiếng Việt và phần mềm miễn phí FreeOCR.net để scan và nhận dạng tài liệu tiếng Anh. Tuy nhiên, cách này sẽ ngốn nhiều thời gian của bạn khi thực hiện.

Số hóa tài liệu

- Tạo file PDF: Bạn chạy phần mềm Softi Scan to PDF, bấm chọn chuẩn scan ở ô Select Scanner, chọn 200 ở ô DPI và chọn Color ngay sau ô DPI, đánh dấu chọn trước hàng chữ Show Scanner Dialog, bấm nút Scan, bấm nút Preview, quét chọn hoặc điều chỉnh vùng tài liệu scan, bấm nút Scan, bấm nút để xoay tài liệu về hướng thẳng đứng (đọc từ trên xuống), thực hiện scan trang tài liệu tiếp theo hoặc cùng chủ đề, hoặc bấm nút Save PDF để lưu file.

- Tạo file hình: Đối với tài liệu hình ảnh, bạn có thể scan tạo file hình bằng chương trình Photoshop, hoặc chia theo từng chủ đề rồi scan để lưu chúng trong một file PDF theo cách trên. Bạn chạy Photoshop, bấm menu File > Import > WIA…, chọn chế độ scan màu, giữ nguyên độ phân giải 200 hoặc tăng lên.

- Tạo file văn bản: Nếu là văn bản tiếng Anh, bạn cài và chạy phần mềm FreeOCR.net (www.softi.co. uk/freeocr24.exe); bấm nút Scan để scan tài liệu cần thực hiện hoặc bấm nút Open để mở file tài liệu đã scan và lưu ở dạng file hình, bấm nút OCR; nội dung văn bản của tài liệu sẽ hiện trong khung bên trái, bạn có thể lưu thành file text hoặc copy vào các chương trình khác. Xong, bấm nút Clear Text Windows xóa nội dung và bắt đầu cho tài liệu khác. Còn để scan và lưu thành file văn bản tiếng Việt từ các tài liệu tiếng Việt, bạn cài phần mềm VnDOCR (www.vndocr.com). Cửa sổ làm việc của chương trình này cho phép bạn scan file tài liệu hoặc mở file tài liệu đã scan và lưu ở dạng file hình. Tuy nhiên chương trình này còn khá nhiều hạn chế (chẳng hạn, chỉ làm việc với file hình đen trắng nhưng lại không có chức năng chuyển file hình màu về dạng đen trắng theo chuẩn của chương trình…) nên việc thực hiện cực kỳ khó nhọc.

Những thao tác tối ưu

Nhờ dùng công nghệ mới và phần mềm hỗ trợ scan của nhà sản xuất, hiện nay đa số các máy scan đều có tính năng tự động nhận dạng vùng tài liệu cần scan trên trang giấy và bỏ đi những vùng trống xung quanh tài liệu, hoặc tự động nhận và bắt (chọn) tất cả các tài liệu đặt rời rạc trên mặt quét của máy scan rồi lần lượt quét các vùng chọn. Cách này sẽ giúp bạn đỡ nhọc công nhưng tài liệu thu được sẽ không rõ.

Tốt nhất, bạn hãy bấm nút Preview, quét chọn vùng scan rồi bấm nút Scan. Khi bấm nút Preview, đèn quét của máy sẽ đi qua tất cả các vùng mà tài liệu đang chiếm trên mặt quét, do vậy nếu đặt cùng lúc nhiều tài liệu trên mặt quét thì bạn sẽ mất nhiều thời gian chờ hơn so với việc đặt từng tài liệu vào mặt quét.

Khi thực hiện scan, dung lượng trống của phân vùng ổ đĩa C sẽ cạn dần nhưng phần dung lượng này sẽ được khôi phục khi bạn lưu file hay tắt các chương trình scan. Do vậy, bạn chừa hoặc dọn dẹp sao cho phân vùng ổ đĩa C còn trống ít nhất là 3 GB.

Mỗi thiết bị có chức năng quét hình vào máy tính (máy scan, camera, webcam…) thường có 2 chuẩn scan, được phân biệt bằng tiền tố TWAIN hoặc WIA trước tên thiết bị. Trong đó, chuẩn WIA thường dễ dùng hơn so với chuẩn TWAIN.

Khi scan, bạn chỉ cần để độ phân giải 200 dpi là vừa, không cần thiết lập cao hơn làm tăng kích thước file, và nên chọn chế độ scan màu (color) thay vì chế độ đơn sắc (Grayscale hoặc Black and White) để giữ nguyên hình ảnh thực của tài liệu. Tuy nhiên, đối với một số tài liệu bị ố vàng, bạn có thể chọn chế độ scan đơn sắc để thấy tài liệu mới hơn.

Bạn có thể khắc một con dấu làm tên tủ sách của mình và đóng lên bề mặt tài liệu trước khi scan để nhận dạng được tài liệu của mình khi thất thoát hoặc để người đọc biết đến công trình của bạn.

Một khi đã số hóa tài liệu, ngoài việc lưu trữ file tài liệu trên đĩa cứng, bạn có thể ghi chúng lên đĩa CD/DVD để tạo thêm bản dự phòng.

MỜI CÁC BẠN ĐÓN ĐỌC NHỮNG BÀI VIẾT CHỌN LỌC VỀ VI TÍNH INTERNET, THỦ THUẬT VÀO LÚC 7H30, 13H, VÀ 16H CÁC NGÀY TRONG TUẦN, TẠI 24H.COM.VN

Tổng hợp (24H.COM.VN)

Mời các bạn đón đọc những bài viết chọn lọc về VI TÍNH INTERNET, thủ thuật vào lúc 7h30, 13h, và 16h các ngày trong tuần tại 24h.com.vn

  Video chọn lọc
Xem thêm chủ đề: PDF, van ban, USB
Thông tin cần biết
Sự kiện tiêu điểm
Về trang chủ 24hVề đầu trang
X
CNT2T3T4T5T6T7