SUPERVISOR
Nader Fathianpour,Alberto Suarez
نادر فتحیان پور (استاد راهنما) آلبرتو سووارز (استاد مشاور)
STUDENT
Bahram Jafrasteh
بهرام جفرسته
FACULTY - DEPARTMENT
دانشکده معدن
DEGREE
Doctor of Philosophy (PhD)
YEAR
1391
TITLE
An intelligent algorithm to improve ore grade and reserve estimation
reserve estimation. Different factors including physical and structural characteristics of the deposit control the distribution of ore grade value. Metallic deposits and related systems have variable features. Various models has been proposed to describe their structural and spatial patterns. Generally, the data used in grade estimation are complicated, non-linear and of high variance and skewness. Traditional methods including geometrical and geostatistical ones often are not able to accurately handle the relationship among data. On the other hand, these methods need an expert with a lot of knowledge and also some assumption about the data which are not practically affordable. To improve the accuracy of grade estimation and also explore variability pattern hidden in data, complicated machine learning algorithms are used as an alternative estimation methods. In this study by comparing three selective machine learning methods the problem of improving ore grade estimation in the metallic ore deposits is considered and then a proper method to locate additional drillholes is proposed. The used machine learning methods are feed-forward neural networks, random forests and Guassian processes. After exploratory analysis of the data, multi set of training and test partitions based on drillholes are generated to appropriately compare the used estimation methods. The idea is a good estimator have a better estimation on drillholes that are far away from the training data. To overcome some difficulties of back propagation method, such as local search, a simultaneous perturbation artificial bee colony algorithm (SPABC) is introduced, for training the neural networks. SPABC, a variant of artificial bee colony algorithm (ABC), benefits from the local search of simultaneous perturbation stochastic approximation (A) algorithm and some new equations to improve the global and local search ability of original ABC algorithm. The performance of the proposed algorithm in training neural networks are compared with some other conventional optimization methods. A skewed activation function by introducing a new adjustment parameter is proposed to increase the flexibility and improve the accuracy of the fitted model. A local linear neural network structure is used to improve the generalization ability of the model. The generalization performance of the proposed network is compared with conventional MLP neural networks and other competent networks including wavelet neural networks. The ten-fold cross-validation method is used instead of traditional methodologies to avoid overfitting, explore appropriate number of hidden nodes and improving the generalization ability. Random forest regression was performed after optimizing number of random trees and leaf nodes. Gaussian process (GP) regression is the third machine learning methods which has some similarity to kriging methods. The main difference is related to the kernel parameters which are learned from the training data. Our study shows that the separate standardization of each location inputs may introduce spurious distortion in the geometery of the deposit. Therefore, a standardization method proposed to simultaneously standardize three spatial dimensions. An anisotropic kernel is proposed into the structure of GP to consider the effect of anisotropy and improve the grade estimation. The results of machine learning methods are validated using ordinary kriging and indicator kriging methods as representatives of linear and non-linear geostatistical methods, respectively. The normalized mean squared error as one of the main criterion of the performance evaluation is employed to compare the generalization ability of the used methods. The available data from drill holes of Esfordi phosphate and Sarcheshmeh copper deposit while having different nature of deposition, geological and structural setting are used to validate the performance of the proposed methods. The obtained results for Esfordi deposit show the closeness between the accuracy of GP with the provided specification and the proposed neural networks structure. However, GP is the best method for the Sarcheshmeh copper deposit. Another observation using three spatial dimensions of the deposit with rock types show significant improvement in the ore grade estimation. The estimated results of GP regression as the best estimation method is used to locate additional drill holes in the domains of mineralization. A new objective function is defined to consider the effect of geological composition of the deposit, alongside the estimated grade value and the estimation variance.
خمین ذخیره ماده معدنی یکی از مهمترین مراحل در ارزیابی اقتصادی یک کانسار است. تخمین عیار ماده معدنی به طور مستقیم روی نتایج تخمین ذخیره اثر میگذارد. عوامل مختلفی از جمله مشخصههای فیزیکی و ساختاری کانسار توزیع عیار را کنترل میکنند. خواص کانسارهای فلزی و سیستمهای وابسته به آن بسیار متغیرند و مدلهای متنوعی برای توصیف الگوهای فضایی ساختارهای متنوع و پیچیده آنها بررسی شده است. دادههای مورد استفاده در تخمین عیار اکثرا دارای مدل پیچیده و غیرخطی، واریانس بالا و چولگی زیاد میباشند. روشهای متداول هندسی و زمین آماری موجود در عمل قادر نیستند این روابط را به خوبی شناسایی کنند. از طرفی دیگر این روشها نیاز به فرد متخصص و فرضیاتی دارند که در عمل محقق نمیشود. به منظور بهبود عملکرد تخمین و دقت آنها و همچنین یافتن الگوی تغییرپذیری مناسب حاکم بر دادهها لازم است که عملکرد روشهای پیچیدهتر آموزش ماشین که با یادگیری از دادههای آموزشی پارامترهایشان تنظیم میشود مورد ارزیابی قرار گیرد. در تحقیق حاضر با مقایسه سه روش انتخابی غیرپارامتری آموزش ماشین مسئله بهبود تخمین عیار در کانسارهای فلزی بررسی شده و در پی آن روشی برای موقعیت یابی گمانه های اضافی پیشنهاد می شود. روش های تخمین مورد استفاده با توجه به ماهیت بیان شده در مورد داده ها، شبکه های عصبی پیشرو، جنلگهای تصادفی و فرایندهای گوسی می باشند. برای مقایسه موثر روشهای تخمین، پس از انجام تحلیلهای اکتشافی روی داده ها چند مجموعه مختلف آموزشی و تست بر اساس جدایش گمانه ها تولید شدند. این تقسیم بندی طوری است که روش بهتر روشی است که در نقاطی دورتر از داده های آموزشی تخمین بهتر داشته باشد. در این تحقیق به منظور بهبود عملکرد آموزش، کاهش خطا و افزایش قابلیت تعمیم شبکه های عصبی از الگوریتم کلونی مصنوعی زنبور همراه با آشفتگی \\lr{SPABC} ، تابع فعالسازی گوسی دارای چولگی و ساختار خطی محلی استفاده شد. به منظور غلبه بر برخی از مشکلات روش پس انتشار خطا در آموزش شبکه های عصبی الگوریتم کلونی مصنوعی زنبور همراه با آشفتگی \\lr{SPABC} معرفی شد. این الگوریتم از تغییر در ساختار الگوریتم کلونی مصنوعی زنبور حاصل می شود. الگوریتم معرفی شده در ساختار خود از جستجوی محلی الگوریتم تقریب تصادفی با آشفتگی همزمان و معادلات جدید به منظور بهبود جستجوی کلی و محلی بهره می برد. عملکرد الگوریتم معرفی شده با دیگر الگوریتم های متداول بهینه سازی تایید می شود. تابع فعالسازی شبکه عصبی با معرفی یک پارامتر اضافی تنظیم کننده به منظور افزایش انعطاف پذیری و بهبود برازش به تابعی دارای چولگی تغییر می یابد. همچنین به منظور بهبود قابلیت تعمیم شبکه عصبی از ساختار خطی محلی در شبکه عصبی استفاده می شود. قابلیت تعمیم شبکه با ساختارهای تغییر یافته فوق با روش پرسپترون چندلایه و دیگر شبکه های رقیب از جمله شبکه موجک مقایسه می شود. برای یافتن بهترین تعداد گره، جلوگیری از بیش برازش و استفاده حداکثری از داده ها، روش اعتبارسنجی متقابل ده تایی بکار گرفته شد. در تحقیق حاضر پس از تعیین تعداد بهینه درختهای تصادفی و همچنین تعداد داده های رسیده به هر برگ روش رگرسیون جنگلهای تصادفی به کار گرفته شد. روش رگرسیون غیرخطی فرایندهای گوسی به عنوان سومین روش آموزش ماشین در تخمین با توجه به شباهت به روش زمین آماری کریجینگ مورد توجه قرار گرفت. تفاوت اصلی روش با کریجینگ در یادگیری پارامترهای کرنل از داده های آموزشی است. مطالعات انجام شده نشان داد که استانداردسازی هر کدام از موقعیت های جغرافیایی به تنهایی میتواند موجب تغییر در هندسه کانسار و در نتیجه کمتر شدن قابلیت تعمیم شود. بنابر این روشی برای استانداردسازی همزمان سه بعد فضایی کانسار معرفی شد. همچنین به منظور در نظر گرفتن اثر ناهمسانگردی و بهبود قابلیت تخمین با استفاده از روش فرایندهای گوسی یک کرنل ناهمسانگرد در ساختار این روش معرفی شد. روش کریجینگ معمولی و کریجینگ شاخص بترتیب به عنوان نماینده روش های خطی و غیرخطی زمین آماری برای اعتبارسنجی تخمین های انجام شده توسط روشهای آموزش ماشین به کار گرفته شدند. معیار مربعات خطای نرمال شده به عنوان یکی از معیارهای مهم خطا در مقایسه قابلیت تعمیم روش های استفاده شده به کار گرفته شد. بهمنظور اعتبارسنجی روشهای استفادهشده در این تحقیق، دادههای موجود در گمانههای کانسار فسفات اسفوردی بعنوان نماینده کانسارهای غیرفلزی و کانسار مس سرچشمه بعنوان نماینده کانسارهای فلزی با داشتن ماهیت کانی زایی و ساختار زمین شناسی متفاوت مورداستفاده قرار گرفتند. نتایج بهدستآمده از تخمین عیار نشان میدهد که نتایج روش فرایندهای گوسی با تمهیدات در نظر گرفته شده در تخمین عیار فسفات در کانسار اسفوردی با روش شبکه های عصبی با ساختار معرفی شده در این تحقیق بسیار نزدیک می باشد. حال آنکه تخمینهای انجام شده در کانسار مس سرچشمه توسط فرایندهای گوسی بسیار بهتر از شبکه های عصبی می باشد. همچنین بررسی اثر جنس سنگی نشان میدهد که اضافه کردن این متغیر میتواند موجب بهبود قابل توجه دقت تخمین عیار شود. رگرسیون فرایندهای گوسی بعنوان بهترین روش تخمینی در تعیین موقعیت گمانه های اضافی در محدوده کانی سازی شده مورد استفاده قرار گرفت. تابع جدیدی به منظور تعیین موقعیت گمانه های اضافی با در نظر گرفتن اثر جنس سنگ در کنار عیار و واریانس تخمینی معرفی شد. پارامترهای مورد استفاده در این تابع با استفاده از روشی مبتنی بر اعتبارسنجی متقابل بهینه سازی شد.