مدیریت فایل، انواع فایل، سیستم فایل، ویژگی های فایل. فایل چیست فایل داده چیست

03.03.2020 تلویزیون (تلویزیون هوشمند)

تمام اطلاعات موجود در متغیرها و آرایه ها با پایان برنامه ناپدید می شوند. اگر ممکن است در آینده به آن نیاز باشد، این اطلاعات روی هارد دیسک، فلاپی دیسک یا رسانه های دیگر ذخیره می شود و دفعه بعد که برنامه راه اندازی می شود، از رسانه خارجی در آرایه ها یا متغیرها بارگذاری می شود. به چنین ضبطی بر روی دیسک یا رسانه های دیگر گفته می شود فایل اطلاعات. علاوه بر فایل های داده، نیز وجود دارد فایل های اجرایی(برنامه ها در کد ماشین با پسوند exe یا .com). برخی از زبان ها و سیستم های برنامه نویسی (از جمله لهجه های پاسکال - Borland Pascal و Delphi) به شما امکان می دهند چنین فایلی را از برنامه خود اجرا کنید. پاسکال ABC این گزینه را ندارد.

فایل ها در گروه ها (دایرکتوری ها یا پوشه ها) گروه بندی می شوند. برای تعیین اینکه با کدام فایل کار کنید، آن را مشخص کنید نام و نام خانوادگی. از چندین بخش تشکیل شده است، به عنوان مثال:

دایرکتوری که برنامه ما در آن قرار دارد دایرکتوری کاری (جاری) است. این بدان معناست که هنگام دسترسی به فایل داده ای که در چنین دایرکتوری قرار دارد، نیازی به تعیین مسیر نیست.

برای استفاده از فایل دیتا در برنامه در قسمت VAR نیاز دارید یک متغیر فایل را توصیف کنید(f/n)، که اطلاعات مربوط به این فایل (نام کامل، طول، تاریخ و زمان ایجاد و غیره) را ذخیره می کند. این توضیحات برای انواع مختلف فایل متفاوت است. مثلا:

در فایل‌هایی که به‌عنوان معمول توصیف می‌شوند، همه داده‌ها از یک نوع هستند (مشخص شده در توضیحات)، درست مانند آرایه‌ها. بنابراین محتویات آرایه ها معمولا در چنین فایل هایی ذخیره می شوند. ذخیره متن در یک فایل استاندارد ناخوشایند است، زیرا طول تمام خطوط باید یکسان باشد. یک فایل متنی برای ذخیره متن با خطوط با طول های مختلف استفاده می شود. برای جدا کردن یک خط از خط دیگر، در چنین فایلی هر خط با یک کاراکتر مربوط به کلید ENTER خاتمه می یابد. علاوه بر رشته‌ها، می‌توانید اعداد را در یک فایل متنی نیز ذخیره کنید (اما این نسبت به یک فایل استاندارد که در کد باینری ذخیره می‌شوند، مقرون به صرفه‌تر است، نه کاراکتر به کاراکتر).

به نام فایل را در یک متغیر فایل قرار دهید، از دستور استفاده می شود

assign(f/n، 'نام کامل فایل');

در این دستور، لازم نیست مسیر فایلی را که در دایرکتوری کاری (همان محل خود برنامه) قرار دارد، مشخص کنید.

برای اینکه سایر اطلاعات مربوط به فایل در متغیر فایل گنجانده شود، باید باشد باز کنبا استفاده از یکی از دستورات زیر:

تنظیم مجدد (f/n)؛ - یک فایل از قبل موجود را باز می کند و یک اشاره گر را در ابتدای آن تنظیم می کند (معمولاً به این ترتیب یک فایل برای خواندن باز می شود، اما می توانید در یک فایل استاندارد نیز بنویسید. نوشتن به جای داده های موجود در فایل رخ می دهد).

ضمیمه (f/n); - یک فایل از قبل موجود را باز می کند و یک اشاره گر را در انتهای آن تنظیم می کند (برای افزودن اطلاعات پس از پایان فایل).

بازنویسی (f/n); - یک فایل جدید ایجاد می کند (اگر فایل از قبل وجود داشته باشد، پاک می شود).

نشانگر فایل مکانی را در فایل ذخیره می کند که می توانیم اطلاعات را از آن بخوانیم (یا بنویسیم). هر عملیات خواندن یا نوشتن نشانگر را به رکورد بعدی منتقل می کند.

به خواندن اطلاعات از فایل، با قرار دادن آن در یک متغیر، از دستورات استفاده می شود:

read(f/n، لیست متغیرها)؛ - از یک فایل استاندارد و متنی می خواند.

readln(f/n، لیست متغیرها)؛ - از یک فایل متنی می خواند.

اگر نه کلمات یا اعداد مجزا از یک فایل متنی، بلکه کل خط خوانده شود، تنها از یک متغیر رشته ای استفاده می شود.

write(f/n، لیست متغیرها)؛ - روی یک فایل استاندارد و متنی می نویسد.

writeln(f/n، لیست متغیرها)؛ - در یک فایل متنی با فید خط می نویسد.

برای حرکت در یک فایل (فقط معمولی!) از دستور seek(f/n، رکورد شماره) استفاده کنید. . شماره گذاری رکوردهای فایل از صفر شروع می شود. برای رسیدن به انتهای فایل برای افزودن رکورد جدید، از تابع filesize(f/n) به عنوان عدد در این دستور استفاده می‌شود که اندازه فایل را تعیین می‌کند (نه در بایت، بلکه در رکوردهای یک نوع معین).

هنگام خواندن از فایلی با طول ناشناخته، می توانید قبل از خواندن بررسی کنید که آیا فایل هنوز با استفاده از تابع eof(f/n) به پایان نرسیده است، که اگر نشانگر بعد از آخرین رکورد باشد، مقدار true را برمی گرداند. مثلا:

پس از اتمام کار با فایل، باید بستندستور بستن (f/n)؛ . اگر این کار را انجام ندهید، پاسکال تغییرات فایل را در دیسک ذخیره نمی کند. اما حتی اگر تغییری ایجاد نشده باشد، توصیه می شود فایل را ببندید. پس از این، متغیر فایل و بافرهای فایل (منطقه حافظه ای که پاسکال هنگام کار با حافظه از آن استفاده می کند) آزاد می شوند.

دستور rename(f/n,'new_name') نام فایل مرتبط با متغیر فایل را تغییر می‌دهد. پرونده باید بسته شود.

دستور erase(f/n) فایل مرتبط با متغیر فایل را حذف می کند. پرونده باید بسته شود.

عملیات فایل همیشه موفقیت آمیز نیست. به عنوان مثال، وقتی سعی می کنید از فلاپی دیسکی که فراموش کرده اید در درایو قرار دهید بخوانید، یک پیغام خطا ظاهر می شود و برنامه از کار می افتد. بهتر است از بروز چنین خطاهایی جلوگیری شود. اگر فایلی با نام (و مسیر) روی دیسک وجود داشته باشد، تابع FileExists('name') True را برمی گرداند، در غیر این صورت False را برمی گرداند. باید قبل از تلاش برای دسترسی به یک فایل موجود استفاده شود. اگر نیاز به ایجاد یک فایل جدید دارید، ابتدا از تابع CanCreateFile('name') استفاده می شود. اگر نام یا مسیر فایل نادرست باشد یا فضای دیسک وجود نداشته باشد یا به دلایل دیگر امکان ایجاد فایل با آن نام وجود نداشته باشد، False را برمی گرداند.

اگر روی کامپیوتر خود نصب کرده اید برنامه آنتی ویروسمی توان تمام فایل های موجود در رایانه خود و همچنین هر فایل را به صورت جداگانه اسکن کنید. شما می توانید هر فایلی را با کلیک راست روی فایل و انتخاب گزینه مناسب برای اسکن فایل برای ویروس ها اسکن کنید.

به عنوان مثال، در این شکل برجسته شده است فایل my-file.data، سپس باید روی این فایل کلیک راست کرده و در منوی فایل گزینه را انتخاب کنید "اسکن با AVG". با انتخاب این گزینه، AVG Antivirus باز می شود و فایل را از نظر ویروس اسکن می کند.

گاهی ممکن است در نتیجه خطایی رخ دهد نصب نادرست نرم افزار، که ممکن است به دلیل مشکلی باشد که در مراحل نصب به وجود آمده است. این ممکن است با سیستم عامل شما تداخل داشته باشد فایل DATA خود را به نرم افزار کاربردی صحیح پیوند دهید، تحت تأثیر قرار دادن به اصطلاح "ارتباطات پسوند فایل".

گاهی ساده نصب مجدد مایکروسافت اکسلمی تواند مشکل شما را با پیوند دادن صحیح DATA به Microsoft Excel حل کند. در موارد دیگر، مشکلات مرتبط با فایل ممکن است ناشی از برنامه نویسی نرم افزار بدتوسعه دهنده و ممکن است لازم باشد برای کمک بیشتر با توسعه دهنده تماس بگیرید.

توصیه:سعی کنید مایکروسافت اکسل را به آخرین نسخه به روز کنید تا مطمئن شوید که آخرین اصلاحات و به روز رسانی ها را دارید.

این ممکن است خیلی بدیهی به نظر برسد، اما اغلب ممکن است خود فایل DATA باعث این مشکل شده باشد. اگر فایلی را از طریق یک پیوست ایمیل دریافت کردید یا آن را از یک وب سایت دانلود کردید و روند دانلود قطع شد (مانند قطع برق یا دلایل دیگر)، فایل ممکن است آسیب ببیند. در صورت امکان، یک کپی جدید از فایل DATA تهیه کنید و دوباره آن را باز کنید.

با دقت:یک فایل آسیب دیده می تواند باعث آسیب جانبی به بدافزار قبلی یا موجود در رایانه شما شود، بنابراین مهم است که رایانه خود را با یک آنتی ویروس به روز به روز نگه دارید.

اگر فایل DATA شما مربوط به سخت افزار کامپیوتر شمابرای باز کردن فایلی که ممکن است نیاز داشته باشید به روز رسانی درایورهای دستگاهمرتبط با این تجهیزات

این مشکل معمولاً با انواع فایل های رسانه ای مرتبط است، که به باز کردن موفقیت آمیز سخت افزار در داخل رایانه بستگی دارد، به عنوان مثال. کارت صدا یا کارت گرافیک. به عنوان مثال، اگر می خواهید یک فایل صوتی را باز کنید اما نمی توانید آن را باز کنید، ممکن است نیاز داشته باشید به روز رسانی درایورهای کارت صدا.

توصیه:اگر وقتی سعی می کنید یک فایل DATA را باز کنید دریافت می کنید پیغام خطای فایل SYS، مشکل احتمالاً می تواند باشد مرتبط با درایورهای دستگاه خراب یا قدیمیکه باید به روز شوند این فرآیند را می توان با استفاده از نرم افزار به روز رسانی درایور مانند DriverDoc آسان تر کرد.

اگر مراحل مشکل را حل نکردو شما همچنان در باز کردن فایل های DATA با مشکل مواجه هستید، ممکن است به این دلیل باشد کمبود منابع سیستم در دسترس. برخی از نسخه‌های فایل‌های DATA ممکن است به مقدار قابل توجهی از منابع (مانند حافظه/رم، قدرت پردازش) نیاز داشته باشند تا به درستی در رایانه شما باز شوند. اگر از سخت افزار کامپیوتر نسبتا قدیمی و در عین حال از یک سیستم عامل بسیار جدیدتر استفاده می کنید، این مشکل بسیار رایج است.

این مشکل ممکن است زمانی رخ دهد که رایانه در انجام یک کار مشکل داشته باشد زیرا ممکن است سیستم عامل (و سایر سرویس‌های در حال اجرا در پس‌زمینه) برای باز کردن فایل DATA منابع زیادی مصرف کنید. سعی کنید قبل از باز کردن Analysis Studio Offline Data، تمام برنامه های رایانه شخصی خود را ببندید. آزاد کردن تمام منابع موجود در رایانه شما بهترین شرایط را برای تلاش برای باز کردن فایل DATA فراهم می کند.

اگر شما تمام مراحل توضیح داده شده در بالا را انجام دادو فایل DATA شما هنوز باز نمی شود، ممکن است لازم باشد اجرا کنید به روز رسانی تجهیزات. در بیشتر موارد، حتی زمانی که از نسخه‌های قدیمی‌تر سخت‌افزار استفاده می‌کنید، قدرت پردازش همچنان می‌تواند برای اکثر برنامه‌های کاربر بیش از حد کافی باشد (مگر اینکه کارهای زیادی با CPU انجام دهید، مانند رندر سه بعدی، مدل‌سازی مالی/علمی، یا کار فشرده چند رسانه ای). بدین ترتیب، این احتمال وجود دارد که رایانه شما حافظه کافی نداشته باشد(که معمولاً "RAM" یا حافظه دسترسی تصادفی نامیده می شود) برای انجام وظیفه باز کردن یک فایل.

فایل های داده

در طول توسعه برنامه ها، اغلب نیاز به ذخیره و پردازش اطلاعات ذخیره شده وجود دارد. این اطلاعات می تواند بسیار متنوع باشد: داده های اولیه برای حل مسائل، نتایج محاسبات، لیست ها و غیره. برای ذخیره چنین اطلاعاتی می توان از فایل های پایگاه داده استفاده کرد. فایل های داده متنی هستند. بسته به سازماندهی داده ها روی دیسک ها یا سایر رسانه های ماشینی، فایل های متنی به فایل هایی تقسیم می شوند دسترسی متوالی، فایل های دسترسی مستقیمو فایل های باینری.

فایل های متنی متوالی (فایل های متوالی)هیچ ساختاری ندارند ساختار این فایل ها توسط خود برنامه خواندن تعیین می شود. در فایل‌های متنی متوالی، هر خط با دو کاراکتر خاص پایان می‌یابد: پایان خط و بازگشت بار که با فشار دادن کلید Enter روی صفحه‌کلید، در متن برنامه وارد می‌شوند. بنابراین، یکی از ساده‌ترین راه‌ها برای پردازش یک فایل متنی متوالی، خواندن خط به خط آن است. ایجاد فایل های متنی با دسترسی متوالی نیز دشوار نیست. می توان آن را با هر ویرایشگر متنی ایجاد کرد. داده ها به صورت متوالی بایت به بایت در یک فایل متوالی نوشته می شوند. برای تجزیه و تحلیل و انتخاب اطلاعات لازم، فایل باید به طور کامل خوانده شود. این امر باعث افزایش نیاز به رم و کاهش سرعت اجرای برنامه می شود.

فایل های متنی دسترسی مستقیم (فایل های دسترسی مستقیم)برای خواندن و نوشتن متن یا فایل های باینری ساختار یافته با رکوردهای با طول ثابت طراحی شده اند. آنها به شما این امکان را می دهند که داده ها را با شماره رکورد از یک فایل بنویسید و بازیابی کنید. این امر زمان صرف شده برای جستجو و بازیابی داده ها را کاهش می دهد. با این حال، این استفاده ناکارآمد از فضای دیسک است، زیرا طول هر فیلد در رکورد باید از قبل مشخص شود.

فایل های باینری(دودویی) برای خواندن و نوشتن داده های ساختار یافته دلخواه استفاده می شود. فایل‌های باینری، به عبارت دقیق‌تر، یک نوع فایل جدید نیستند، بلکه یکی از راه‌های مدیریت فایل‌ها از هر نوع هستند. روش های کار با فایل های باینری به شما این امکان را می دهد که هر بایتی از یک فایل را بخوانید و تغییر دهید.

برای کار با فایل های داده، از دستورات برای باز کردن یک فایل، بستن یک فایل، نوشتن و خواندن داده ها از یک فایل و همچنین تعدادی توابع استفاده می شود که کار با فایل ها را آسان تر می کند. همه این دستورات برای همه نسخه های زبان پایه سنتی هستند.

باز کردن فایل ها

برای باز کردن فایل ها از دستور استفاده کنید باز کن .

"file_spec" را برای (نوع فایل) باز کنید

به عنوان[#]N

گزینه " file_spec همانطور که مشخص است، به شما امکان می دهد درایو، مسیر، نام و پسوند نام فایل را مشخص کنید. به عنوان مثال: R:/Prognoz/Ucheb/prognoz1.dan. برای استفاده از یک فایل بر روی کامپیوترهای دارای سیستم عامل MS DOS، نام فایل و پسوند آن باید طبق قوانین سیستم عامل MS DOS تشکیل شود. یعنی در نام فایل و پسوند نام فایل فقط از نویسه ها و اعداد لاتین می توان استفاده کرد، نام فایل باید با یک حرف شروع شود، طول نام فایل نباید از 8 کاراکتر تجاوز کند و پسوند نام فایل نباید از چهار کاراکتر تجاوز کند. شخصیت ها، از جمله یک دوره. نقطه و فاصله در نام فایل مجاز نیست. مشخصات فایل در داخل گیومه قرار داده شده است.

گزینه برای نوع فایل را تعیین می کند. نوع فایل ساختار و کاربرد آن را نشان می دهد و می تواند مقادیر زیر را داشته باشد:

ورودی– فایل دسترسی متوالی، باز برای خواندن؛

خروجی– فایل دسترسی متوالی، باز برای نوشتن؛

ضمیمه- فایل دسترسی متوالی، باز برای اضافه کردن داده ها.

باینری– فایل باینری برای نوشتن و خواندن داده ها باز است:

تصادفی– فایل دسترسی مستقیم برای نوشتن و خواندن داده ها باز است.

گزینه دسترسی داشته باشید حقوق دسترسی به داده ها را هنگام کار در شبکه های کامپیوتری تعیین می کند. می تواند سه معنی داشته باشد:

خواندن- خواندن داده ها از فایل مجاز است.

نوشتن- نوشتن داده ها در یک فایل مجاز است.

بخوانید بنویسید- مجاز به خواندن و نوشتن داده ها. این حالت دسترسی پیش فرض است.

گزینه قفل کردن . از آنجایی که حالت خواندن و نوشتن معمولاً برای کار با فایل‌هایی است که می‌توانند توسط بسیاری از کاربران یا برنامه‌ها به اشتراک گذاشته شوند، لازم است از یکپارچگی داده‌ها هنگام اشتراک‌گذاری اطمینان حاصل شود. برای این منظور از پارامتر blocking استفاده می شود که می تواند مقادیر زیر را بگیرد:

به اشتراک گذاشته شده است- فایل می تواند توسط همه فرآیندها برای خواندن و نوشتن داده ها استفاده شود.

LockRead- ممنوعیت خواندن هیچ فرآیند دیگری نمی تواند داده ها را از فایل بخواند. اگر هیچ فرآیند دیگری در حال حاضر عملیات خواندن را انجام نمی دهد، این گزینه را می توان تنظیم کرد.

LockWrite- ممنوعیت ضبط هیچ فرآیند دیگری نمی تواند داده ها را در فایل بنویسد. اگر هیچ فرآیند دیگری در حال حاضر عملیات نوشتن را انجام نمی دهد، این گزینه را می توان تنظیم کرد.

LockReadWrite- ممنوعیت نوشتن و خواندن داده ها اگر هیچ فرآیند دیگری در حال حاضر عملیات نوشتن یا خواندن را انجام نمی دهد، این پارامتر را می توان تنظیم کرد.

گزینه مانند - شماره کانال را مشخص می کند. امضا کردن # را می توان حذف کرد. تعداد کانال می تواند از 1 تا 255 باشد. تعداد کانال های باز همزمان با محدودیت های سیستم عامل مشخص شده در فایل Config.sys تعیین می شود.

گزینه لن - فقط در فایل های دسترسی مستقیم استفاده می شود. طول رکورد را بر حسب بایت تعیین می کند.

در افتتاحیا به عبارت دیگر مقداردهی اولیهفایل ها عملیات زیر انجام می شود:

یک ارتباط بین مشخصات فایل و شماره برنامه آن برقرار می شود. بنابراین، در تمام عملیات های بعدی با این فایل، به شماره کانال اشاره می شود، نه به مشخصات فایل.

یک بافر سیستم یا نرم افزاری که برای اجرای دستورات ورودی/خروجی استفاده می شود پین شده است. استفاده از بافر تعداد دسترسی های برنامه به دیسک را کاهش می دهد و در نتیجه سرعت نوشتن و خواندن داده ها را افزایش می دهد.

مقادیر اولیه پارامترهای واقع در بلوک به اصطلاح کنترل فایل تشکیل می شود.

بسته شدن فایل ها

برای بستن فایل ها از دستور استفاده کنید بستن . دستور دستور:

بستن [#<номер канала> ]

دستور Close با پارامتر شماره کانال کانال مشخص شده را می بندد. دستور Close بدون پارامتر تمام فایل های باز را می بندد. دستور Close بافر را پاک می کند و به سیستم عامل دستور می دهد تا جدول تخصیص فایل را به روز کند.

دستورات برای نوشتن داده در یک فایل و خواندن اطلاعات از فایل های داده به نوع فایل بستگی دارد.

فایل داده MathCAD11 باید به سادگی یک فایل ASCII باشد. MathCAD11 فایل‌هایی را می‌خواند که از اعدادی تشکیل شده‌اند که با کاما، فاصله‌ها یا برگردانده‌های حامل از هم جدا شده‌اند. در زیر نمونه‌هایی از برخی از فایل‌هایی که توسط MathCAD11 خوانده می‌شوند، با فرض اینکه در فرمت ASCII نوشته شده‌اند، آورده شده است:

§ یک فایل ایجاد شده با خروجی داده ها از صفحه گسترده به دیسک.

§ ستونی از اعداد که در یک واژه پرداز تایپ شده و در قالب ASCII ذخیره شده است.

§ نتیجه یک برنامه نوشته شده به زبان سطح بالا.

§ داده های صادر شده از پایگاه داده.

اعداد موجود در فایل های داده می توانند اعداد صحیحی مانند 3 یا -1، اعداد ممیز شناور مانند 2.54 یا نماد علمی مانند 4.51E -4 (برای 4.5 10 -4) باشند. به عنوان مثال، لیست اعداد زیر یک رشته معتبر در فایل داده MathCAD11 خواهد بود:

200، 50 25.1256، 16E – 2، – 16.125E15

MathCAD11 همچنین داده ها را در فایل های ASCII ذخیره می کند. فایل‌های داده‌ای که توسط MathCAD11 ذخیره می‌شوند حاوی اعدادی هستند که با فاصله‌ها و برگردانده‌های حمل از هم جدا شده‌اند. اسناد MathCAD11 خود به این معنا فایل داده نیستند. تنها راه برای ایجاد یک فایل داده از MathCAD11 استفاده از توابع دسترسی به فایل است.

توابع دسترسی به فایل

MathCAD11 دارای شش تابع دسترسی به فایل است بخوان، بنویس, ضمیمه, READPRN, WRITEPRN , APPENDPRN. خواص آنها:

§ نام تابع باید با حروف بزرگ چاپ شود.

§ اگر MathCAD11 نتواند یک فایل داده را پیدا کند، تابع دسترسی مربوطه را با پیام خطا علامت گذاری می کند. فایل پیدا نشد" اگر MathCAD11 سعی کند فایلی با فرمت نامناسب را بخواند، تابع را با پیام " پرچم گذاری می کند. خطای فایل”;

§ سمت چپ اپراتور انتساب با استفاده از یکی از توابع نوشتن, ضمیمه, WRITEPRN، APPENDPRN، نباید حاوی چیز دیگری باشد.

§ هر برابری جدید با استفاده از توابع دسترسی، فایل داده را دوباره باز می کند. برای مثال، هنگام خواندن داده ها، هر برابری جدید در ابتدای فایل شروع به خواندن می کند.

§ در یک برابری، فایل فقط یک بار می تواند باز شود. این بدان معناست که اگر تابع خواندنبا آرگومان نام فایل یکسان دو بار در یک معادله استفاده می شود (این در صورت استفاده از یک آرگومان گسسته امکان پذیر است)، بار دوم خواندنخواندن را از جایی که برای اولین بار خواندن به پایان رسید آغاز می کند. از آنجا که READPRNکل فایل را می خواند، یعنی این READPRNنمی توان با یک آرگومان دو بار در یک برابری استفاده کرد - بار دوم READPRNچیزی برای خواندن باقی نخواهد ماند.

§ اگر از دو برابری در یک سند کاری استفاده شود نوشتنیا WRITEPRNبا یک آرگومان، داده های برابری دوم روی داده های اولی نوشته می شود. باید استفاده شود ضمیمهیا APPENDPRNاگر نیاز دارید اولین قطعه داده را ذخیره کنید. این توابع داده های جدید را به فایل موجود اضافه می کنند.

روی میز بخش 6.1 این شش عملکرد را توضیح می دهد.

جدول 6.1

توابع دسترسی به فایل

تابع	معنی

خواندن( فایل)	یک مقدار را از یک فایل داده می خواند. یک اسکالر را برمی‌گرداند. به طور معمول به شرح زیر استفاده می شود: v i:=READ(" فایل")
نوشتن( فایل)	مقدار را در فایل داده می نویسد. اگر فایل از قبل وجود دارد، آن را با یک فایل جدید جایگزین کنید. در تعاریف شکل زیر استفاده می شود: WRITE( فایل) := vمن
APPEND( فایل)	یک مقدار را به یک فایل موجود اضافه می کند. در تعاریف شکل زیر استفاده می شود: APPEND( فایل) := vمن
READPRN( فایل)	یک فایل داده ساخت یافته را می خواند. یک ماتریس را برمی گرداند. هر ردیف در فایل داده به یک ردیف در ماتریس تبدیل می شود. تعداد عناصر در هر خط باید یکسان باشد. معمولاً به این صورت استفاده می شود: A: = READPRN( فایل)

انتهای جدول 6.1

دومین فایل مورد نیاز برای کار See5 فایل داده است. دارای پسوند *.data است. در مورد ما این فایل است USR. داده ها.

هر شیء در فایل داده ردیف خاص خود را دارد. اگر مقدار متغیر هدف در بالای فایل نام متغیر باشد، خط با مقدار آن متغیر هدف شروع می شود. سپس مقادیر سایر مشخصه ها با کاما از هم جدا می شوند. مقادیر متغیر ناشناخته با علامت سوال "؟" و به دنبال آن یک نوار عمودی "|" رمزگذاری می شوند. می توانید نظراتی را بنویسید که مورد قبول سیستم نیست.

در زیر کل فایل دیتا آمده است USR. داده هاکه از آن برای نشان دادن قابلیت های See5 استفاده خواهیم کرد.

فایل های داده تست (اختیاری)

برای بررسی کیفیت درخت تصمیم ساخته شده و مجموعه قوانین منطقی مربوطه، سیستم See5 توانایی کار با فایل‌های ویژه‌ای که حاوی داده‌های آزمایشی اضافی هستند را فراهم می‌کند.

نوع سوم فایل مورد استفاده توسط سیستم See5 حاوی اشیاء آزمایشی جدید است. این همان چیزی است که نمونه کنترل نیز نامیده می شود. این فایل USR. تستاختیاری است و در صورت استفاده، فرمت فایل را که قبلاً توضیح داده شده است دارد USR. داده ها.

فایل پشتیبانی بعدی USR. مواردنیز اختیاری است. این شامل اشیایی با طبقه بندی ناشناخته است.

فایل هزینه

آخرین نوع فایل تعیین شده USR. هزینه ها، حاوی اطلاعاتی در مورد هزینه خطاهای طبقه بندی مختلف است. تکمیل این فایل اختیاری است. با این حال، تعیین مجازات برای خطاها می تواند هنگام توسعه برخی از برنامه ها بسیار مفید باشد.

رابط کاربری

پنج دکمه در پنجره اصلی See5 وجود دارد (شکل 1). بیایید آنها را از چپ به راست فهرست کنیم.

با استفاده از یک دکمه مکان یابی کنید دا ta (موقعیت داده ها) پنجره ای را برای مشاهده فایل های داده موجود و بارگذاری آنها در سیستم باز می کند.

با لمس یک دکمه ساختن طبقه بندی (ساخت یک طبقه بندی کننده) برای انتخاب نوع طبقه بندی کننده و تنظیم پارامترهای آن به کادر محاوره ای دسترسی پیدا می شود. دکمه Stop برای توقف فرآیند ساخت درخت تصمیم در نظر گرفته شده است.

دکمه استفاده کنید طبقه بندی(استفاده از طبقه بندی کننده) فرآیند طبقه بندی تعاملی یک یا چند شی را آغاز می کند. با استفاده از دکمه Cross-Reference، پنجره ای فراخوانی می شود که در آن ارتباطات بین اشیاء مجموعه آموزشی و قوانین قابل مشاهده برای طبقه بندی آنها به وضوح آشکار می شود.

تمامی عملکردهای فوق از منوی File نیز در دسترس هستند. به نوبه خود، در منو ویرایش کنید امکان ویرایش فایل نام داده ها و فایل هزینه خطای طبقه بندی وجود دارد.

برنج. 1. پنجره اصلی سیستم دیدن5

ساختن درخت تصمیم

در مرحله اول پردازش داده ها معمولاً از پارامترهای پیش فرض سیستم استفاده می شود. دکمه را فشار دهید ساختن طبقه بندیو سپس در کادر محاوره ای که ظاهر می شود (شکل 29) بلافاصله کلیک کنید 0K(با فرض فایل داده USR. داده a قبلا بارگذاری شده است). سیستم یک پنجره نتایج را نمایش می دهد که شبیه این است (شکل 3). خط اول گزارش نتایج اطلاعاتی در مورد نسخه سیستم See5 استفاده شده و زمان فعلی ارائه می دهد. سپس دو خط بعدی می گویند که متغیر طبقه بندی کننده است تشخیصو فایل دیتا را بخوانید USR. داده هاشامل 74 شی است که هر کدام با یازده ویژگی توصیف شده است.

شکل 2. پنجره گفتگو برای تنظیم پارامترهای الگوریتم طراحی طبقه بندی کننده

خطوط زیر گزارش درخت تصمیم ساخته شده را نشان می دهد. می توان آن را به صورت زیر تفسیر کرد:

اگر فهرست مطالب بیش از 0.69 و سرعت بیش از 18، سپس کلاس شماره 3، در غیر این صورت

اگر فهرست مطالب بیش از 0.69 و سرعت بیش از 18 و ضخامت حداکثر 46، به کلاس شماره 1

و غیره.

هر شاخه از درخت به تعداد کلاسی که به آن منتهی می شود خاتمه می یابد. بلافاصله بعد از شماره یک ورودی از نوع(های) یا است (p/t).به عنوان مثال، اولین شاخه با ورودی (12,0) به پایان می رسد. این به این معنی است که این شاخه با 12 شی از یک کلاس خاص (سوم) مطابقت دارد. آخرین شاخه با رکورد 1 (6.0/1.0) به پایان می رسد، که از آن نتیجه می شود که این شاخه کلاس شماره 1 را توصیف می کند و 6 شی در اینجا قرار می گیرند که 1 اشتباه است. مقادیر پیا تیدر صورتی که هر شاخه دارای تعداد معینی از اشیاء با مقادیر مشخصه ناشناخته باشد، ممکن است کسری باشد.

بخش بعدی گزارش، ویژگی‌های طبقه‌بندی‌کننده ساخته شده را که بر روی نمونه آموزشی ارزیابی شده است، ارائه می‌کند. در اینجا می بینیم که درخت تصمیم ساخته شده دارای 9 شاخه است (اندازه = 9) و خطای طبقه بندی روی 5 شی مشاهده می شود که 6.8٪ است.

که در بخش پایانی گزارش شامل یک جدول با تجزیه و تحلیل دقیق نتایج طبقه بندی است. بر اساس داده های این جدول، می توان گفت که از کلاس 1 (کلیه های سالم)، 20 شی به درستی طبقه بندی شده اند و 2 شی به اشتباه به عنوان کلاس 2 طبقه بندی شده اند. در بین اشیاء کلاس 2 (کیست های متعدد)، 35 مورد به درستی تشخیص داده می شوند و 2 به اشتباه به عنوان سالم تشخیص داده می شوند. تمام اشیاء کلاس 3 (هیدرونفروز) به استثنای یک شی که در کلاس شماره 2 قرار می گیرد به درستی طبقه بندی می شوند.

در نهایت، سیستم See5 پیامی در مورد زمان صرف شده برای راه حل نمایش می دهد. در مورد ما 0.5 ثانیه بود. در اینجا لازم به ذکر است که الگوریتم See5 عموماً با سرعت بسیار بالایی عمل می کند و به آن اجازه می دهد تا آرایه های اطلاعاتی با ابعاد بالا حاوی هزاران و ده ها هزار رکورد را به سرعت پردازش کند.

ما می توانیم نتایج طبقه بندی خود را با جزئیات بیشتری تجزیه و تحلیل کنیم. برای انجام این کار، روی دکمه Cross-Reference در پنجره اصلی See5 کلیک کنید. سیستم پنجره ای را نمایش می دهد که در نیمه سمت چپ آن درخت تصمیم ساخته شده ترسیم شده است و در نیمه سمت راست اشیایی که روی یک یا شاخه دیگر درخت می افتند فهرست شده اند. برای انتخاب شاخه مورد نظر، باید با دکمه سمت چپ ماوس روی آن کلیک کنید (یک دایره تاریک در سمت راست شاخه ظاهر می شود - یک فلش در شکل 4 به آن اشاره می کند). علاوه بر این، اگر روی شماره یک شی در قسمت سمت راست کلیک کنید، سیستم پنجره دیگری به نام Case را نمایش می دهد که مقادیر مشخصه ها و شی انتخاب شده را نمایش می دهد. در مورد نشان داده شده در شکل، ما به شاخه (شاخص<=0.69 и Age.<"43), на которой находятся 10 объектов из 1-го класса и 1 объект из 2-го класса.

برنج. 4. نمایش نتایج طبقه بندی در پنجره ارجاع متقابل

مدیریت فایل، انواع فایل، سیستم فایل، ویژگی های فایل. فایل چیست فایل داده چیست

فایل های داده تست (اختیاری)

فایل هزینه

رابط کاربری

ساختن درخت تصمیم

بهترین مقالات در این زمینه