CLI-তে HTML ফাইলগুলিকে পঠনযোগ্য করতে html2text সুবিধাজনক
হ্যালো, আমি অযোগ্য।
প্রায় এক বছর ধরে, আমি একজন প্রাক্তন জাপানি বন্ড ডিলারের পোস্টগুলি নিম্নলিখিত স্থানে দেখছি:
তরুণ জ্ঞান
তবে, যেহেতু এই ব্যক্তি সরাসরি html ফাইলগুলি সম্পাদনা করছেন বলে মনে হয় এবং আমি অতীতের নিবন্ধগুলি পরীক্ষা করতে পারছি না, তাই আমি নিয়মিতভাবে সেগুলি সংগ্রহ করতে এবং পড়তে চাই যা আমি সময়মতো পড়তে পারিনি, যাতে পরে সেগুলি পড়া সহজ হয়। ব্রাউজার থেকে সরাসরি html পড়া ঠিক আছে, তবে cat করার সময় এটি পরিচালনা করা কঠিন।
তাই, আমি ভেবেছিলাম এমন কিছু আছে কিনা যা এই ধরনের অধঃপতিত মানুষের জন্যও সহজে পঠনযোগ্য মার্কডাউন ফর্ম্যাটে রূপান্তর করতে পারে, এবং দেখা গেল আছে।
html2text ইনস্টল করুন
sudo pacman -Sy artix-archlinux-support
sudo pacman -S html2text
curl কে html2text এ পাস করুন
এটি এখন আরও পঠনযোগ্য হবে।
curl "https://soulminingrig.com/" | html2text
যদি এটি একটি টেক্সট-ভিত্তিক সাইট হয়, তবে এটি সংরক্ষণ করার জন্য বেশ ভাল হতে পারে, তবে ছবিগুলির জন্য সঠিক পাথ নির্দিষ্ট করতে হবে এবং সেই প্রক্রিয়াটি আলাদাভাবে করতে হবে।
সবচেয়ে বড় কথা, টেক্সট-ভিত্তিক দেখার সুবিধা হল grep করা সহজ, এবং মার্কডাউন ব্যবহার করে SSG-তে HTML রূপান্তর প্রক্রিয়া পাস করে স্থানীয়ভাবে নিজের জন্য একটি সাইট সেট আপ করাও সহজ হয়।
আমি কোনোভাবেই Markdown চরমপন্থী নই, তবে Scrapbox ডেভেলপারদের মতো Markdown কে ঘৃণা করি না।
মার্কআপ ভাষা - তোশিউকি মাসুই
সম্প্রতি জনপ্রিয় মার্কআপ ভাষাগুলির মধ্যে একটি হল মার্কডাউন। এটি HTML কে আরও সংক্ষিপ্তভাবে লেখার জন্য তৈরি করা হয়েছে বলে মনে হয় এবং GitHub ইত্যাদিতে এটি মানক হওয়ায় প্রকৌশলীদের মধ্যে এটি জনপ্রিয়। তবে, সত্যি বলতে, এটি খুব বেশি ঝামেলার। এমনকি আমার মনে হয় কাঁচা HTML লেখা আরও সহজ। আমি চাই এটি দ্রুত বিলুপ্ত হয়ে যাক, তবে সমস্যা হল অনেক প্রকৌশলী যারা আধা-হৃদয়ে মার্কডাউনে অভ্যস্ত, তারা ভুলভাবে মনে করেন যে 'মার্কডাউন সেরা!'। Scrapbox এর মার্কআপ সিনট্যাক্স Wiki, HTML, Scribe, TeX, roff, এবং markdown সহ সবকিছুর অভিজ্ঞতা অর্জনের পর গৃহীত হয়েছে, তাই আমি কৃতজ্ঞ থাকব যদি সেই বিষয়গুলি বিবেচনা করে আলোচনা করা হয়। (যদি আরও ভাল এবং সেরা সিনট্যাক্স থাকে, তবে আমরা সানন্দে তা গ্রহণ করব)।
আমার কাছে যদি এটি বহুমুখী হয় এবং লিখতে ঝামেলা না হয়, তবে লেখার পদ্ধতি নিয়ে আমার বিশেষ কোনো পছন্দ নেই, তাই আমি আপাতত Markdown ব্যবহার করছি।