• 0
Abdo_cs

أريد تحويل ملف txt إلى arff باستخدام Weka ؟

سؤال

بسم الله الرحمن الرحيم

السلام عليكم ورحمة الله

كيف حالكم ؟ إن شاء الله بخير ؟

مثل ما هو واضح من العنوان , أنا عندي مجلد كامل فيه ملفات txt وأريد أن أعمل لها تنقيب بواسطة الـ WEKA Tool ؟

طبعا مثل ما تعرفون بأن الـ Weka يتعامل فقط مع ملفات ARFF , سؤالي أريد تحويل txt إلى ARFF ؟

وهذي صورة للخطأ اللي يواجهني مع الآداة ؟ موجودة بالمرفقات ,,

ممكن الطريقة اللي أقوم بها خطأ ! ؟ ياليت من لديه علم يعطيني الخطوات الصحسحة للتحويل ؟

وشكرا ,,,

post-259177-058457200 1332022348_thumb.j

0

شارك هذا الرد


رابط المشاركة
شارك الرد من خلال المواقع ادناه

4 إجابة على هذا السؤال .

  • 0

السلام عليكم ..

  1. اضغط ok على هذه الرسالة , و سظهر لك مربع حوار يطلب منك تحديد الــ Loader المناسب .. و يكون بشكل افتراضي محدد weka.core.converters.CSVLoader و يمكنك تغييره من الزر choose
  2. الملف النصي يجب أن يكون بتنسيق محدد حتى يتم تحويله بشكل صحيح .. أول سطر اجعله لأسماء الأعمدة , و فيه اسم العمود ثم tab .. لأن space (جربتها و أعطاني فقط عمود واحد) .. و في الاسفل القيم و بينها أيضا Tab . مثال :
    name	age 
    1 1
    2 3
    3 2

  3. ثم تأخذ save (من الأعلى ) . للحفظ بالتنسيق المناسب ..

1

شارك هذا الرد


رابط المشاركة
شارك الرد من خلال المواقع ادناه
  • 0

أخ حسام الله يرفع قدرك دنيا وآخـره

بالنسبة لردك , أنا المستند عندي نصي ما فيه أي أرقام , ووضعت عينه بالمرفقات .

طبعا سيكون عندي أكثر من ملف txt , موجودين كلهم في مجلد واحد , والذي سأضعه بالمرفقات ملف واحد فقط txt .

طبعا المستندات النصية تتحدث عن الأقسام في جامعه معينه , ووصف موجز لكل قسم ,

والموجود بالمرفقات مستند يتحدث عن قسم تخصص الاقتصاد .

أريد أن تخبرني كيف أرتب الـ Data في المستند لأحفظها كـنوع arff باستخدام الاداة weka ؟

وألف شكر على ردك أخي الغالي ,,

Economics.txt

تم تعديل بواسطه Abdo_cs
0

شارك هذا الرد


رابط المشاركة
شارك الرد من خلال المواقع ادناه
  • 0

السلام عليكم ...

بارك الله بك أخي ...

  1. اطلعت على الملف ... هل تريد قراءته كله كنص .. أم تريد اخذ القيم منه مثلا :
    Phone: 832-2725

    .. تريد أن يعرف أن الــ Phone قيمته كذا ..؟؟ لو كان هذا مطلبك يجب أن تكون البيانات (حسب معلوماتي) بتنسيق مفهوم (بينها tab أو Comma مثلا) ... اما لو كان للبيانات تنسيق حاص بك .. فيمكنك كتابة كود صغير يقرا الملف سطر سطر .. و يقوم بالمعالجة المناسبة لكل سطر (مثلا القيم قبل : النقطين هي اسم المتحول و بعدها هي القيمة مثلا ..)..و يحول البيانات إلى قاعدة بيانات مثلا أو ملف XML ...

  2. أما لو أردت حفظ ملفاتك بتنسيق arff فقم بفتح أحد الملفات الموجودة في المجلد data داخل الــ weka .. افتحة بالــ notepad و سترى التنسيق مثل :
    % Deleted "vendor" attribute to make data consistent with with what we
    % used in the data mining book.
    %
    @relation 'cpu'
    @attribute MYCT real
    @attribute MMIN real
    @attribute MMAX real
    @attribute CACH real
    @attribute CHMIN real
    @attribute CHMAX real
    @attribute class real
    @data
    125,256,6000,256,16,128,199
    29,8000,32000,32,8,32,253
    29,8000,32000,32,8,32,253
    29,8000,32000,32,8,32,253
    29,8000,16000,32,8,16,132
    26,8000,32000,64,8,32,290

    حيث % هي تعليق و @Attribute اسم العمود و نوعه و @relation اسم الجدول ..

  3. تنسيق CSV يعتبر الاسهل .. حيث أول سطر هو اسماء الأعمدة ..و الاسطر البقية هى البيانات و يفصل بينها tab أو comma .
  4. يوجد تنسيقات اخرى مدعومة في الــ weka لا أعرف عنا شئ ..

1

شارك هذا الرد


رابط المشاركة
شارك الرد من خلال المواقع ادناه
  • 0

أشكر لك عودتك أستاذ حسام :)

في البداية حتى تتضح الصورة لك وللإخوان ,,

أنا عندي مشروع وهو Text Mining

طبعا حتى تعرف نص قادم !

لابد أن يكون لديك نص مشابه قد تم حقظه مسبقا (training test ) , وتبدأ تقارن النص الجديد مع الداتا المحفوظه لديك .

طبعا الملف الذي وضعته في سؤالي هنا في هذا الموضوع , هو أحد ملفات الـ ( training test ) , أريد أن أحفظ هذه الملفات حتى أتعامل معها !

السؤال بطريقة أخرى : أنا عندي ملفات من نوع txt وسأجعلها هي training test كيف السبيل لذلك ؟

مع العلم بأن الأداة كما ذكرت هي Weka Tool

وشكرا لك أستاذي حسام ,,

1

شارك هذا الرد


رابط المشاركة
شارك الرد من خلال المواقع ادناه

من فضلك سجل دخول لتتمكن من التعليق

ستتمكن من اضافه تعليقات بعد التسجيل



سجل دخولك الان

  • يستعرض القسم حالياً   0 members

    لا يوجد أعضاء مسجلين يشاهدون هذه الصفحة .