CLI-তে HTML ফাইলগুলিকে পঠনযোগ্য করতে html2text সুবিধাজনক

3 min

language: ja bn en es hi pt ru zh-cn zh-tw

হ্যালো, আমি অযোগ্য।
প্রায় এক বছর ধরে, আমি একজন প্রাক্তন জাপানি বন্ড ডিলারের পোস্টগুলি নিম্নলিখিত স্থানে দেখছি:
তরুণ জ্ঞান
তবে, যেহেতু এই ব্যক্তি সরাসরি html ফাইলগুলি সম্পাদনা করছেন বলে মনে হয় এবং আমি অতীতের নিবন্ধগুলি পরীক্ষা করতে পারছি না, তাই আমি নিয়মিতভাবে সেগুলি সংগ্রহ করতে এবং পড়তে চাই যা আমি সময়মতো পড়তে পারিনি, যাতে পরে সেগুলি পড়া সহজ হয়। ব্রাউজার থেকে সরাসরি html পড়া ঠিক আছে, তবে cat করার সময় এটি পরিচালনা করা কঠিন।
তাই, আমি ভেবেছিলাম এমন কিছু আছে কিনা যা এই ধরনের অধঃপতিত মানুষের জন্যও সহজে পঠনযোগ্য মার্কডাউন ফর্ম্যাটে রূপান্তর করতে পারে, এবং দেখা গেল আছে।

html2text ইনস্টল করুন

sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text

curl কে html2text এ পাস করুন

এটি এখন আরও পঠনযোগ্য হবে।

curl "https://soulminingrig.com/" | html2text 

যদি এটি একটি টেক্সট-ভিত্তিক সাইট হয়, তবে এটি সংরক্ষণ করার জন্য বেশ ভাল হতে পারে, তবে ছবিগুলির জন্য সঠিক পাথ নির্দিষ্ট করতে হবে এবং সেই প্রক্রিয়াটি আলাদাভাবে করতে হবে।

সবচেয়ে বড় কথা, টেক্সট-ভিত্তিক দেখার সুবিধা হল grep করা সহজ, এবং মার্কডাউন ব্যবহার করে SSG-তে HTML রূপান্তর প্রক্রিয়া পাস করে স্থানীয়ভাবে নিজের জন্য একটি সাইট সেট আপ করাও সহজ হয়।
আমি কোনোভাবেই Markdown চরমপন্থী নই, তবে Scrapbox ডেভেলপারদের মতো Markdown কে ঘৃণা করি না।
মার্কআপ ভাষা - তোশিউকি মাসুই

সম্প্রতি জনপ্রিয় মার্কআপ ভাষাগুলির মধ্যে একটি হল মার্কডাউন। এটি HTML কে আরও সংক্ষিপ্তভাবে লেখার জন্য তৈরি করা হয়েছে বলে মনে হয় এবং GitHub ইত্যাদিতে এটি মানক হওয়ায় প্রকৌশলীদের মধ্যে এটি জনপ্রিয়। তবে, সত্যি বলতে, এটি খুব বেশি ঝামেলার। এমনকি আমার মনে হয় কাঁচা HTML লেখা আরও সহজ। আমি চাই এটি দ্রুত বিলুপ্ত হয়ে যাক, তবে সমস্যা হল অনেক প্রকৌশলী যারা আধা-হৃদয়ে মার্কডাউনে অভ্যস্ত, তারা ভুলভাবে মনে করেন যে 'মার্কডাউন সেরা!'। Scrapbox এর মার্কআপ সিনট্যাক্স Wiki, HTML, Scribe, TeX, roff, এবং markdown সহ সবকিছুর অভিজ্ঞতা অর্জনের পর গৃহীত হয়েছে, তাই আমি কৃতজ্ঞ থাকব যদি সেই বিষয়গুলি বিবেচনা করে আলোচনা করা হয়। (যদি আরও ভাল এবং সেরা সিনট্যাক্স থাকে, তবে আমরা সানন্দে তা গ্রহণ করব)।

আমার কাছে যদি এটি বহুমুখী হয় এবং লিখতে ঝামেলা না হয়, তবে লেখার পদ্ধতি নিয়ে আমার বিশেষ কোনো পছন্দ নেই, তাই আমি আপাতত Markdown ব্যবহার করছি।

Related Posts