نمونه ترجمه مقاله فیزیک

ترجمه مقاله فیزیک

ترجمه مقاله فیزیک

محاسبه جریان نوری

حرکت دو بعدی تصویر، انعکاس حرکت سه بعدی اشیا، نسبت به یک حسگر چشمی، در میدان تصویر آن می باشد.

توالی های تصاویر دارای ترتیب زمانی، تخمین حرکت دو بعدی تصویر منعکس شده را مانند سرعتهای لحظه ای تصویر یا جابجایی های مجزای تصویر ممکن می سازد. این موارد اغلب زمینه جریان نوری یا میدان سرعت تصویر نامیده می شوند.

چنین فراهم کرده اند که جریان نوری تقریب قابل اطمینان به حرکت دو بعدی تصویر است، که می تواند برای بازیابی حرکت سه بعدی سنسور بصری (بین فاکتور مقیاس) و ساختار سه بعدی سطح (شکل یا عمق نسبی) از طریق فرضیه های مرتبط ساختار میدان جریان نوری، محیط سه  بعدی و حرکت حسگر استفاده شود.

جریان نوری همچنن می تواند برای انجام آشکارسازی حرکت، قطعه بندی اشیا، زمان-به –برخورد، و تمرکز محاسبات انبساط، کدبندی جبران حرکت، و اندازه گیری اختلافات فضایی استفاده گردد..

ما محاسبه جریان نوری را در این بررسی مورد بحث قرار دادیم: روش های شناخته شده برای تخمین جریان نوری به وسیله دقت فرضیه ها و فرض هایی که آنها استفاده کردند، طبقه بندی و آزموده شد. این بررسی، از بحث مسائل تحقیق حاضر منتج شد.فهرست شکل ها

شکل 1 -1- a) (راست): اسکلت توالی تصویر Yosemite fly-throug تولید شده با Lynn Quam در SRI و b) (چپ): جریان نوری.

شکل 2-1: معادله محدودیت جریان نوری، یک خط را در فضای سرعت تعریف می کند. سرعت نرمال v به صورت محور عمود بر خط محدودیت تعریف می شود، به عبارتی، سرعت با بزرگنمایی کمتر روی خط محدودیت جریان نوری.

شکل 3-1- از طریق روزنه های 1 و 3، به دلیل فقدان ساختار محلی، تنها حرکات نرمال لبه های تشکیل دهنده مربع می تواند تخمین زده شود. در داخل روزنه 2، در نقطه ی گوشه، حرکت به طور کامل می تواند اندازه گیری شود، در حالی که ساختار محلی کافی وجود دارد؛ هر دو حرکت نرمال قابل مشاهده است.

شکل 4-1- مدل محاسبه سلسله مراتبی .  تخمین های حرکت بزرگ  به سطوح ریزتر منعکس شده که به عنوان تخمین های اولیه وارد شده به تصفیه به کار می روند.

شکل 5-2- اگر حداقل دو تخمین جریان نرمال در امتداد حدفاصل متفاوت باشند، سرعت کل حدفاصل می تواند به طور یکنواخت تعیین شود.

شکل 6-2- تجزیه تصویر سلسله مراتبی: تصویر اصلی در مجموعه سلسله مراتبی شبکه های فرکانسی قبل از تخمین جریان نوری تجزیه شده اند.

شکل 7-2- خط محدودیت از نقطه مرکزی ناحیه تصویر، متقاطع با خطوط محدودیت نقاط تصویر همسایه در نظر گرفته شده است. دسته های تقاطع اجازه می دهد تا الگوی سرعت غالب تعیین شود.

شکل 8-2-  a) سمت چپ: تناسب حداقل مربعات در میان ابر نقاط. b)سمت راست:  تناسب قوی در میان ابر نقاط مشابه. تابع تاثیر توزیع احتمالات Lorentzian ، تمایل به سرعت صفر برای انحراف از میانگین دارد. اینها به عنوان پرت (داده ی پرت) در نظر گرفته می شوند.

1- مقدمه

مشکل اساسی در توالی پردازش تصویر، محاسبه ی جریان نوری می باشد، یک تقریب به حرکت تصویر، که به عنوان انعکاس سرعت نقاط سه بعدی سطح در زمینه تصویر برداری یک حسگر بصری تعریف شده است.

جریان نوری، اغلب نمایش حرکت تصویر مناسب و مفید می باشد. به هرحال، ، گاهی اوقات، شرح دهندگان دیگری بسیار عمومی تر از جریان نوری برای حرکت تصویر وجود دارد ، مانند مدل های پارامتری حرکت، یا شرح دهندگان سازگار با مفاهیم منحصر بفرد، مانند زمانی که  قسمتی یا تمامی اجزای هندسی صحنه یا حرکت حسگر بصری، از پیش تعیین شده باشد.

اهمیت حرکت در پردازش بصری نمی تواند انجام نگرفته باشد: تقریب های حرکت تصویر، می تواند برای تخمین ویژگی های صحنه ی 3 بعدی و پارمترهای حرکت از یک حسگر بصری متحرک  ، برای انجام قطعه بندی حرکت، محاسبه تمرکز انبساط و زمان- به- برخورد، انجام کدبندی جبران حرکت تصویر، محاسبه اختلاف فضایی، اندازه گیری جریان خون و حرکت دیواره قلب در تصویر برداری پزشکی، و اخیرا برای اندازه گیری مقادیر رشد دقیقه ای در نهال ذرت استفاده شود.

1-1- نمونه های حرکت و ساختار

به طور سنتی، تقریب های حرکت تصویر برای استنباط egomotion و ساختار صحنه ایتفاده می شده است.

با این هدف، نمونه های مختلف حرکت و ساختار توسعه یافته اند، که گاهی اوقات از جریان نوری به عنوان نمایش حد واسط حرکت استفاده می کرده اند که بین ویژگی های تصویر، همبستگی ها یا ویژگی های ساختار های شدت مطابقت ایجاد می کرده است. این نمونه ها عموما در سه گروه طبقه بندی شده اند:

شکل 1 -1- a) (راست): اسکلت توالی تصویر Yosemite fly-throug تولید شده با Lynn Quam در SRI و b) (چپ): جریان نوری.

 سرعت: حرکت سه بعدی و ساختار صحنه ممکن است از میدان های سرعت دو بعدی، با نسبت دادن پارامترهای حرکت و ساختار به جریان نوری استنباط گردند. این پارامترها، سرعتهای ترجمه ی آنی و چرخش، و پارامترهای ممکن سطح یا عمق نسبی را شامل می شود .

اختلاف: اختلافات تصاویر، که به عنوان مطابقتهای ویژگی های تصاویر، یا همبستگی های ناحیه ای ایجاد شده، می تواند برای محاسبه ی محورهای انتقال سه بعدی، ماتریس های چرخش و صفات سطح استفاده شود.

شدت: شدت تصاویر و مصتقات آنها گاهی اوقات مستقیما برای به دست آوردن پارامترهای حرکت و شیء استفاده می شود، بنابراین از نمایش حدواسط آشکار حرکت تصویر مانند جریان نوری یا میدان های اختلاف دوری می کند.

معمولا، نسبت تخمین حرکت تصاویر یا مشتقات شدت به حرکت سه بعدی و پارامترهای ساختاری به مجموعه ای از معادلات غیر خطی منجر می گردد. 

علاوه بر این، هر کدام از این نمونه ها، بسته به استفاده ی مورد نظر و ویژگی های تصویربرداری، محاسن و معایب خود را دارند. به هرحال، ارزیابی آنها فراتر از محدوده ی این بررسی است.

2-1- جریان نوری

اولین فرضیه در اندازه گیری حرکت تصویر این است که ساختارهای  شدت محدوده ی ناحیه ای متغیر با زمان تصویر، تحت حرکت برای حداقل برای یک دوره کوتاه، تقریبا ثابت است. رسما، اگر I(x,t) تابع شدت تصویر باشد، سپس

که x δ  جابجایی ناحیه تصویر محلی در (x,t) ، بعد از زمان t δ می باشد. بسط سمت چپ این معادله در سری تیلور به ما می دهد:

کهI= (Ix,Iy)   و It مشتق جزئی مرتبه اول  I(x,t) و O2 عبارت دوم و مراتب بالاتر می باشد، که ناچیز فرض شده است. کم کردن I(x,t) از دو طرف معادله ، نادیده گرفتن O2 و مشتقات t δ به ما می دهد:

I= (Ix,Iy)     که   شیب شدت فضایی و u, υ) v = ( سرعت تصویر می باشد.معادله (1.3) به عنوان معادله محدودیت جریان نوری شناخته شده و محدودیت منفرد ناحیه ای در حرکت تصویر را تعریف می کند. (شکل 2-1 را ببینید).

به هرحال، این محدودیت برای محاسبه ی هر دو جزء v کافی نیست، همانطور که معادله محدودیت جریان نوری به خوبی مطرح نشده است.

بایدگفت تنها v ، جزء حرکت در جهت شیب محلی تابع شدت تصویر، می تواند تحمین زده شود. این پدیده، به عنوان مساله شکاف شناخته می شود، و فقط در موقعیت های تصویر که ساختار شدت کافی وجود دارد (یا منحنی گوسین) حرکت می تواند با استفاده از معادله محدودیت جریان نوری تخمین زده شود (شکل 3-1  را ببینید).

شکل 2-1: معادله محدودیت جریان نوری، یک خط را در فضای سرعت تعریف می کند. سرعت نرمال v به صورت محور عمود بر خط محدودیت تعریف می شود، به عبارتی، سرعت با بزرگنمایی کمتر روی خط محدودیت جریان نوری.

برای مثال، سرعت سطحی که هموژن است یا در بردارنده ی بافتی با جهت یکنواخت می باشد که نمی تواند به صورت نوری پوشش داده شود، در حالی که سرعت نرمال که در جهت شیب فضاییI, (1.3) می باشد،  اجازه می دهد که بنویسیم:

بنابراین، اندازه گیری مشتقات فضایی زمانی، به بازیابی سرعت نرمال تصویر اجازه می دهد.

از این تعریف، روشن می شود که برای جریان نوری تا تصویر دقیقا متحرک، تعدادی از شرایط لازم است تا مطلوب باشد.

که عبارتند از: a) روشنایی یکنواخت؛ b) بازتاب سطح Lambertian؛ و c) ترجمه خالص موازی با صفحه تصویر. درواقع، این شرایط، در این چشم انداز به طور کامل مطلوب نیستند. در مقابل، چنین فرض می شود که این شرایط به طور محلی در صحنه و بنابراین به طور محلی در صفحه تصویر جای گرفته اند.

 مرتبه ای که این شرایط مطلوب هستند، تا قسمتی دقت را تعیین می کنند با آنچه که جریان نوری حرکت تصویر را تقریب می زند.

متناوبا، فرد میتواند جابجایی مسیرهای کوتاه تصویر را، برای مثال با همبستگی، در توالی های کوتاه تصویر اندازه گیری نماید( معمولا 2 یا 3 فریم).  چنین جابجایی های تصویر، زمانی که شرایط معینی ایجاد می شود، تقریب های با ارزشی را برای سرعت تصویر تشکیل می دهد.

به ویژه، نسبت سرعت ترجمه حسگر به عمق محیط مطلق، چرخش های 3 بعدی عمودی و افقی حسگر و قاصله زمانی بین فریم ها باشد مقادیر کوچکی باشد.

جریان نوری، می تواند به عنوان میدان اختلاف محاسبه شود، که دو تصویر فضایی یا دو تصویر همسایه در توالی یکسان می دهد، ویژگی های مورد نظر در  تصاویر استخراج شده و با فرایندهای مورد نظر مطابقت داده می شود.

ضرورتا، انجام آشکارسازی حرکت دو بعدی، پردازش صحنه هایی را شامل می شود که حسگر بین یک محیط حاوی اشیا ثابت و غیر ثابت حرکت می کند. بعلاوه، رخدادهای بصری مانند انسداد، حرکتهای شفاف و اشیاء غیر صلب پیچیدگی ذاتی اندازه گیری جریان نوری را  افزایش می دهد.

شکل 3-1- از طریق روزنه های 1 و 3، به دلیل فقدان ساختار محلی، تنها حرکات نرمال لبه های تشکیل دهنده مربع می تواند تخمین زده شود.

در داخل روزنه 2، در نقطه ی گوشه، حرکت به طور کامل می تواند اندازه گیری شود، در حالی که ساختار محلی کافی وجود دارد؛ هر دو حرکت نرمال قابل مشاهده است.

3-1- پردازش سلسله مراتبی

به طور سنتی، جریان نوری با استفاده از تنها یک مقیاس رزولوشن(قدرت تفکیک) محاسبه  شده بود، که معمولا توسط حسگر بصری تعریف شده بود، که منجر به مشکل اندازه گیری حرکت های بزرگ تصویر می شد.

در این مورد، به دلیل سرعت پایین نمونه گیری و اثر بدنمایی، نامناسب شدند. روش عمومی حل این مشکل، به کار بردن تکینیک های جریان نوری در یک قالب سلسله مراتبی(سازمانی) ، بزرگ به کوچک می باشد.

قالب های سلسله مراتبی، به تصویر اجازه می دهد تا در مقیاس های مختلف رزولوشن، به شکل هرم های گوسین یا لاپلاسین تجزیه گردد.

به دلیل فرکانس پایین نمایش در رزولوشن بزرگ، معادله محدودیت جریان نوری، در مورد حرکات تصاویر در تفکیک های ریز قابل کاربرد می گردد.

علاوه بر این، برای کنترل حرکات سریع، پردازش های سلسله مراتبی، همچنین کارایی محاسبه شده ی افزایش یافته را پیشنهاد می کنند.

در چنین قالب هایی، تخمین های سرعت یا جاجایی، از طریق هر سطح رزولوشن مانند تخمین های اولیه ی در معرض پالایش به صورت آبشاری مرتب می شوند.

در سطوح بزرگ، تخمین های اولیه محاسبه شده و سپس در سطوح ریز تفکیک منعکس شده و یکبار دیگر تصفیه می گردند.

تخمین های نهایی، زمانی به دست آمده اند که تصفیه به ریزترین سطح تفکیک رسیده باشد. (شکل 4-1 را ببینید).

پردازش های سلسله مراتبی، برای بیشتر تکنیک های جریان نوری قابل کاربرد است. برای مثال، Glazer، تکنیک دیفرانسیل Horn and Schunk را به چنین قالبی مطابقت داد، Anandan، روش همبستگی مبتنی بر حوزه ی سلسله مراتبی را استفاده کرد، Heager، تکنیک فیلترینگ سلسله مراتبی مبتنی بر انرژی را  در هرم گوسین پیشنهاد داد،  و Bergen و همکاران مدل های پارامتری سلسله مراتبی را برای جریان نوری پیشنهاد داد.

4-1- مسائل و مشکلات

پیشرفتهای زیادی در محاسبه جریان نوری صورت گرفته و هنوز، به خاطر تعدادی دلایل تئوری و عملی تخمین دقیق آن باقی مانده است.

از نظر تئوری، ما اعتقاد داریم که جریان نوری، مانند یک قریب به حرکت تصویر، عمدتا حد پایین دقت را تعیین می نماید.

علاوه بر این، ویژگی های صحنه مانند بازتاب سطح و رخدادهای تصویر آموزنده مانند شفافیت و انسداد بودند، تا زمان های اخیر، به حد کافی در مدل های زیاد حرکت تصویر در ارتباط نبود.

جریان نوری و حرکت تصویر: تفسیر تغییرات شدت به عنوان حرکت نسبی خالص محدود کننده است، زیرا سرعت یک مقدار ژئومتری مستقل از شرایط روشنایی است. از این رو، تخمین جریان نوری از تغییرات شدت، تنها حرکت تصویر را تقریب می زند.

شرایطی که جریان نوری را از حرکت تصویر متفاوت می سازد، غیاب بافت را شامل می شود، در موردی که جریان نوری صفر باشد، و زمانی که میدان حرکت واقعی، مدل ثبات روشنایی استفاده شده برای تقریب آن را شدت می بخشد.

روشنایی یکنواخت صحنه و بازتاب سطح lumertian، فرضیات روشن یا مهم در بیشتر روش های متداول جریان نوری هستند که برخی فرضیات ثبات روشنایی را استفاده می کنند.

های لایت ها، سایه ها، روشنایی متغیر و نیم شفافی سطح، پدیده های شدت دهنده ی فرضیات هستند و به صورت محدودی مطالعه شده اند.

سطوح انسداد و اشیاء متحرک مستقل

مساله مطرح شده توسط سطوح انسداد یافته، در حال حاضر توسط جامعه پژوهش بیان شده است.

آنالیز انسداد مشکل است، بر خلاف این حقیقت که انسداد منبع مهمی از اطلاعات بصری ایجاد می کند: جریان نوری در مرزهای انسداد ممکن است برای تعیین جهت انتقال و قطعه بندی صحنه به سطوح متحرک مستقل استفاده گردد.

تا زمان های اخیر، بیشتر تکنیک های نوری، به فرضیه های سطح منفرد متکی بود، که یک رخداد بصری کمیاب است.

سختی انسداد کنترل شده در این واقعیت است  که سطح تصاویر ممکن است در زمان، ظاهر یا ناپدید گردد، فرایندهای ردیابی گمراه کننده بوده و سبب مصنوعات عددی در مشتقات شدت گردد.

ترجمه مقاله فیزیک

شکل 4-1- مدل محاسبه سلسله مراتبی .  تخمین های حرکت بزرگ  به سطوح ریزتر منعکس شده که به عنوان تخمین های اولیه وارد شده به تصفیه به کار می روند.

شفافیت: حرکات شفاف ایجاد شده با سطوح فیزیکی نیمه شفاف، همچنین در تصاویر یافت شده اند.

مساله مطرح شده توسط حرکات شفاف ، عمدتا یکی از کنترل های توزیع چندگانه تصویر می باشد.

روش های کلاسیکی برای اندازه گیری جریان نوری که از مدل های حرکت منفرد استفاده می کند، به طور آشکارا نا کافی هستند.

اخیرا، اصول توزیعات و انطباق مختلط، به حرکات شفاف اعمال شده است.

مسائل عملی در محاسبه ی جریان نوری در مطالعه ی اخیر مطرح شده اند که نه تکینیک را از تاریخ 1981 تا 1990، ار لحاظ دقت، چگالی و قابلیت اطمینان اندازه گیری ها آنالیز کرده است.

برای آزمودن اجرای این الگوریتم ها، هر دو داده ی سنتزی و واقعی استفاده شده اند. کارایی مشاهده شده این الگوریتم ها بهنتایج زیر منجر شد:

پیش فیلتر و تمایز: هموارسازی زمانی  برای دوری از alising مورد نیاز است و تمایز عددی باید به دقت انجام شود.

اغلب الزامات اعلام شده که روش های دیفرانسیلی نیاز دارند تا شدت تصویر با حرکت کمتر از یک واحد فضایی نسبت به فریم، نزدیک به خطی باشد، از استفاده از تنها دو فریم، تمایز عددی ضعیف یا تصویر ورودی خراب شده با alising زمانی، ناشی می شود.

با دو فریم، مشتقات با استفاده از تفاوتهای ساده وارونه تخمین زده شده اند که تنها زمانی دقیق هستند که ورودی بسیار بیشتر از نمونه باشد و ساختار شدت نزدیک به خطی باشد.

زمانی کهalising زمانی اجتناب ناپذیر است ، روش های سلسله مراتبی در حالت بزرگ به کوچک عمل می کنند و نتایج بهتری فراهم می نمایند.

اندازه های قابلیت اطمینان: نیاز به اندازه های قابل اطمینان برای نمایش قابلیت اطمینان سرعت های محاسبه شده نمی تواند درک شود.

این اندازه های اطمینان می تواند برای آستانه ی میدان های جریان نوری یا سرعت های وزن که فرایندهای بعد از اندازه گیری است ، استفاده شود. (به عنوان مثال در محاسبات حرکت و  ساختار).

ترجمه مقاله فیزیک

بسیاری از روش های دیفرانسیلی رایج، نمی توانند اندازه گیری های قابل اطمینان فراهم نمایند.

به هرحال، در مطالعه ی Barron  و همکاران، کمترین مقدار ویژه ی یک ماتریکس حداقل مربعات با موفقیت استفاده شده بود.

دیگر احتمالات، تعیین ماتریکس Hessian(منحنی گوسین)، تعداد شرایط یک ماتریکس راه حل، بزرگی شیب های تصویر محلی، مقادیر منحنی اصول را شامل می شود و مقادیر ویژه ی ماتریکس کوواریانس امتحان شده است.

دقت:  روش های همبستگی سلسله مراتبی، طرح های اندازه گیری محکم حرکت تصویر را برای توالی تصویر با تغییرات چشم گیر کنتراست یا جابجایی های بزرگ و alising شدید ایجاد می نماید.

توالی تصویر آزمون که توسط Barron و همکاران استفاده شده است، همگی به طور مناسب با حرکت های کوچک نمونه برداری شده (نوعا بین یک تا جهار پیکسل به ازای هر فریم) و برای روش های دیفرانسیلی مطلوب بوده است.

با این وجود، و به عنوان مخالفت با نتایج تست دیفرانسیلی، آزمایشات آنها نشان داد که روش های همبستگی، با حرکتهای زیر پیکسلی سختی را تجربه کردند ، همانطور که خطای آن به نزدیکی حرکت تصویر به تعداد عدد صحیح پیکسل ها بستگی داشت .

روش های دیفرانسیلی سلسله مراتبی، (بکار گیرنده ی پیچ و تاب تصویر یا ثبت) ممکن است یک جایگزین برای روش های همبستگی فراهم نماید.

یکی از اهداف این مطالعه، آنالیز کارایی روش های مختلف جریان نوری و با هدف تشویق دیگران برای مقایسه ی با سایر نتایج عددی است.

با این هدف، نویسندگان متعددی، هم اکنون کارایی تکنیک های خود را با آنچه که در این مطالعه برای توالی های مشابه تصویر وجود دارد، مقایسه کرده اند.

بعلاوه، برخی کارهای آزمایشگاهی ارزیابی کننده ی تکنیک های دیفرانسیلی اخیرا پدید آمده اند. متاسفانه، انالیزهای کمی برای داده واقعی تصویر غیر ممکن است( برای به دست اوردن جریان نوری صحیح، پارامترهای حرکت سه بعدی مانند مقادیر عمق 3 بعدی در هر جا مورد نیاز است).

ترجمه مقاله فیزیک

در این مورد، تنها یک آنالیز مقداری ممکن است انجام شود، اما مشاهده شده است که برخی میدان های نوری، در حالی که کمتر، به صورت دقیق، کمی شده اند، ممکن است ار لحاظ کیفی بسیار بهتر ظاهر شوند، مانند آنهایی که با روش های ترکیب کننده ی محدودیتهای هموارسازی جهانی به دست آمدند.

ک روش واضح برای ارزیابی محاسبات جریان نوری که هنوز از آنالیز کمی دوری می کند، استفاده از میدان جریان نوری محاسبه شده در محاسبات حرکت و ساختار و آزمایش دقت پارامترهای حرکت 3 بعدی می باشد.

DeMicheli و همکاران ، از میدان های جریان نوری به دست آمده از روش Uras و همکاران، برای تخمین زمان-به-برخورد و سرعت زاویه ای در قالب فیلتر Kalman، با دقت خوبی استفاده کردند.

 اخیرا، Barron and Eagleson، الگوریتم حرکت و ساختار را برای محاسبه اولین و دومین مرتبه عمومی حرکت 3 بعدی ف و پارامترهای ساختاری از  تغییرات زمانی جریان نوری را ، همچنین در یک قالب فیلتر Kalman پیشنهاد کرده اند.

5-1- قلمرو و هدف

در اینجا تعداد زیادی مدل های محاسباتی برای تخمین سرعت تصویر وجود دارد که ما در گروههای اصلی مربوطه دسته بندی کرده ایم: روش های دیفرانسیلی مبتنی بر شدت، روش های جداسازی مبتنی بر فرکانس،. بعلاوه، در این جا روش هایی برای محاسبه ناپیوستگی یا  جریان نوری چند مقداری وجود دارد و تکنیک هایی برای انجام تصفیه های موقت تخمین های حرکت به عنوان اطلاعات بیشتری که از طریق فرایندهای مالکیت تصویر در دسترس قرار می گیرنداین روش ها در گروه های زیر دسته بندی می شوند: روش های حرکت متعدد و روش های تصفیه ی موقت.

بیشتر این روش ها می تواند به عنوان تشکیل یافته از سه مرحله مفهومی پردازش تلقی شوند: پیش فیلتر (پایین-گذر یا band-pass) برای اینکه ساختار های سیگنال مطلوب را استخراج نماید و نسبت سیگنال به نویز را افزایش دهد، استخراج اندازه گیری ساختارهای تصویر پایه، مانند مشتقات فضایی زمانی، یا سطوح همبستگی محلی و یکپارچگی اندازه گیری یا با تنظیم، همبستگی، یا محاسبات حداقل مربعات. تفکر بر این است  که این روش ها بیار هم ارز هستند ، گرچه تفاوت در اجرا می تواند سبب تفاوت چشمگیر در کارایی گردد.

با توجه به این دسته بندی ویژه، این بررسی، تکنیک های کریان نوری را پوشش می دهد که نیازی به حل مسائل همبستگی ندارند.

از این رو، حوزه هایی که توسط این بررسی پوشش داده نمی شوند، روش های اطباق مبتنی بر ویژگی هستند که مسائل مربوطه  و روش های فضایی برای حرکت تصویر را شامل می شوند.

یکی از بیشترین استفاده های اساسی برای جریان نوری، محاسبه ی حرکت 3 بعدی و ساختار می باشد.

نوعا، این الگوریتم های بازسازی، شرایط ضعیفی دارند و دقت جریان نوری بسیار با اهمیت گردیده است.

دست یابی به محاسبات جریان نوری بسیار دقیق، نه تنها به توجه ویژه به جزئیات نیاز دارد بلکه به ایننیاز دارد که ویژگی های تصویر قابل اطمینان باید به حساب آورده شود.

در این بررسی، ما هر دو روش های جدید و قدیمی برای جریان نوری را امتحان کردیم با توجه ویژه  اختصاص یافته به اینکه چگونه روش های جدید، دقت، چگالی و مسائل اطمینان نشات گرفته از Barron و همکاران  را مطرح می کنند.

یک بررسی اخیر، وضعیت فعلی هنر را تا 1988 ، نه تنها برای الگوریتم های جریان نوری نشان می دهد بلکه برای الگوریتم های حرکت مبتنی بر ویژگی را نشان می دهد که به یک راه حل برای مساله مربوطه و الگوریتم های حرکت و ساختار مبتنی بر این دو نمونه نیاز دارد.

2- تکنیک های جریان نوری

ما دسته های مربوط به تکنیک های نوری را بررسی کردیم: a) روش های دیفرانسیلی مبتنی بر شدت، b) روش های چندمحدودیتی، c) روش های مبتنی بر فرکانس، d) روش های مبتنی بر همبستگی، e) روش های چند حرکتی و f) روش های تصفیه  موقت. مرز بین هر دسته از روش ها کاملا واضح نیست.

ترجمه مقاله فیزیک

روش Wang، دو روش مبتنی بر فاز و مبتنی بر ویژگی را با هم ترکیب می کند در حالی که Waxman و همکاران، طرح دیفرانسیل را به نقشه های لبه متغیر با زمان اعمال می کند.

بعلاوه، حرکت متعدد و روش های تصفیه موقت برای جریان نوری با سایر دسته ها هم پوشانی می کند.

به هرحال، اهمیت آنها، نشان می دهد که باید به طور مجزا پوشش داده شوند.

طبق این دسته بندی، ما مثال های نشان دهنده ی وضعیت کنونی کار هنری را در اندازه گیری های جریان نوری نشان دادیم.

1-2- روش های دیفرانسیل

روش های دیفرانسیل، سرعت تصویر را از مشتقات فضایی زمانی شدت تصویر محاسبه می کنند. ناحیه ی تصویر، بنابراین در فضا و زمان پیوسته (مشتق پذیر) در نظر گرفته می شود.

روش های مرتبه اول و دوم بومی و جهانی مبتنی بر (1.3) می تواند برای محاسبه ی جریان نوری استفاده گردد.

روش های جهانی از (1.3)  و یک محدودیت جهانی اضافی ، معمولا یک عبارت تنظیم هموار، استفاده می کنند تا جریان های نوری چگال روی نواحی تصویر را محاسبه نمایند.

روش های محلی از اطلاعات سرعت نرمال در همسایه های بومی، برای به دست آوردن تخمین سرعت استفاده می کنند که تعیین می کند کدام تکنیک مجزا بومی یا جهانی است.

یک مدل سطح یا حدفاصل می تواند برای یکپارچه کردن سرعت های نرمال به سرعت کامل استفاده شود.

انسداد، که با جریان نوری ناپیوسته آشکارشده است، می تواند با فرایندهای خطی، توزیع سرعت مختلط یا مدل های پارامتری آنالیز گردد.

این تکنیک ها، قطعه بندی جریان نوری را به مناطق مرتبط به اشیا یا سطوح مختلف  دارای حرکت مستقل انجام می دهند.

حرکتهای بزرگ 2 بعدی، ممکن است در چارچوب سلسله مراتبی ، احتمالا در ارتباط با روش های پیچ و تاب آنالیز گردد.

1-1-2- روش های جهانی

اغلب، یک استفاده ی واضح از (1.3) در ارتباط با یک عبارت تنظیم ساخته شده است. (معمولا یک محدودیت هموار).

به صورت ترکیبی، آنها یک عملکردی را تشکیل می دهند که روی ناحیه تصویر حداقل (مینیمایز)  شده است.

تنظیم با یک میدان جریان نوری که به آهستگی تغییر می کند، ابتدا توسط Horn and Schunck برای ابهام زدایی اندازه گیریهای نرمال معرفی شد و با این هدف تنظیم شد که سرعت های همسایه اگر با سطح شیء یکسان مرتبط باشند، باید تقریبا یکسان باشند.

این محدودیتها برای تعریف یک خطای عملکردی استفاده شده است:

 

در یک ناحیه ی مطلوب D، که u, υ) v = ( می باشد. راه حل برای v، به عنوان مجموعه معادلات گوس-سیدل ارائه شده که به صورت تکراری حل شده است. روشنایی یکنواخت(حدابل به صورت ناحیه ای) در ناحیه ی تصویر مطلوب، پروجکشن اورتوگرافیک، و حرکت انتقالی خالص موازی با صحنه، شرایطی هستند که باید برای فرضیه ثبات روشنایی باید رعایت شود0=  تا حاصل گردد.

این فرضیات، مجموعه رخداد های بصری مجاز را کاهش می دهند تا موارد تصویری متغیر با زمان قابل اطمینان را کاهش دهند، و بررسی محدودیتهای ایجاد کننده ی معادلات پرکاربرد را سبب می شوند.

برای مثال، حرکت ممکن است سبب یک تغییر در چگالی ویژگی های یک تصویر همسایه ی محلی گردد. 

Schunk  با اصلاح (1.3)  این را محاسبه می کند، از معادله ی پیوسته دینامیک مایعات و تئوری انتقال  استفاده می کند تا به دست آورد که:

این معادله، با (1.3) معادل است، اما برای یک عبارت اضافی حاوی واگرایی جریان است که انبساط یا انقباض یک تصویر همسایه را بیان می کند همانطور که تحت تحولات affine قرار می گیرد.

Nagel پیشنهاد می کند که معادله محدودیت جریان نوری باید به طور واضح مبتنی بر ویژگی های هندسی صحنه ی 3 بعدی و درایوهای آن باشد

که P، نقطه محیطی 3 بعدی می باشد، Ṗ سرعت 3 بعدی ان و ẑ محور واحد در طول  محور خط دید می باشد.

معادله یک هندسه صحنه ی شناخته شده را فرض می کند.

یک ارزیابی آزمایشی این محدودیتها (معادله (1.3)، (2.6) و (2.7) ) در رفرنس (159) نشان دادند که (1.3) زمانی که به داده ی سنتزی ray-traced اعمال می شود، دقت بهتری دارد.

نگهداری پور و Yu، جایگزینی (1.3) را با یک محدودیت رایج تر پیشنهاد کردند که انتقال خطی روی زمان مقادیر شدت تصویر را مدلسازی می کند.

 Prince and McVeigh از معادله ی روشنایی متغیر جریان نوری برای یک کاربرد، با استفاده از توالی تصویر  MR (رزونانس مغناطیسی) مشتق گرفتند.

این معادله ،این واقعیت را به شمار می آورد که   در این تصاویر با شدت مدلسازی، به عنوان تابعی از پارامترهای MR ، حرکت و الگوی ضمیمه القا شده ی مغناطیسی در طی زمان تغییر می کند.

Luettgen  و همکاران، یک الگوریتم تصادفی چندمقیاسی را برای تنظیم محدودیت یکنواختی Horn and Schunck نشان دادند.

الگوریتم تکرار پذیر نیست و اندازه های سازگار (آمارهای کواریانس خطا با مقیاس متعدد)  را فراهم می کند تا سطح رزولوشن بهینه میدان های جریان نوری را تعیین نماید. این چارچوب برای تنظیم دیگر مسائل تنظیم قابل تعمیم است.

Mukawa یک روش تنظیم برای محاسبه ی جریان نوری با یک محدودیت یکنواخت جهانی و دیگر محدودیت ها پیشنهاد کرد که هر دو تاثیر انتشار و نورپردازی ها (همراه با سایه فونگ) برای یک شیء متحرک در یک صحنه با منبع نور را مدل سازی می کند. عبارت تنظیم شده به صورت زیر است:

عبارت اول، محدودیت های یکنواختی  Horn and Schunck را ترکیب می کند. عبارت دوم، معادله محدودیت جریان نوری با عبارت اضافی q است  که اختلاف انتشار و روشنایی نورپردازی در زمان می باشد، همانطور که برای اولین بار توسط  Cornelius and Kanade  پیشنهاد شد.

عبارات سوم و چهارم ارتباط بین مشتقات فضایی روشنایی (qx و qy) و مشتقات شدت تصویر اصلی را استخراج می نماید: qx=cIx و qy=cIy.  c، تابعی است  که محاسبه نسبتهای لومینانس انتشار در زمان های مختلف را شامل می شود.

عبارت چهارم تضمین می کند که c، به آرامی تغییر می کند. ʎ، µ و υ ثابت های ساده ای هستند که اهمیت نسبی هر عبارت در حداقل سازی را توزین می نمایند

2-1-2- مدل های محلی

مدل های محلی سرعت که الگوهای حرکت منفرد را در نظر می گیرند ، متداول هستند. برای مثال، Lacus and Kande، یک مدل ثابت محلی برای v استفاده  کردند که به عنوان راه حل توزین شده ی حداقل مربعات برای (1.3) حل شده است. تخمین های سرعت با حداقل کردن معادله زیر تخمین زده شده است:

که W(x)،  یک تابع پنجره را نشان می دهد و R، همسایه فضایی می باشد. راه حل ها برای v، به شکل مضابه به دست آمده اند.

اصلاحات پیشنهاد شده توسط Smoncelli و همکاران، به استفاده از مقدار ویژه ی ماتریکس حداقل مربعات بکار رفته در حل (2.9)، به عنوان اندازه سازگار در پردازش های متعاقب اجازه می دهد.

Chu and Delp، همچنین از روش حداقل مربعات محلی استفاده کرده و (1.3) را با استفاده از محاسبات کلی حداقل مربعات حل کردند که برای خطاها در It و همچنین برای خطاهای مستقل در Ix و Iy  محاسبه می شود.

Weber and Malik ، از حداقل مربعات کلی در روش های چند محدودیتی خود استفاده کردند. Campani and Verri، یک روش بومی استفاده کردند که تغییرات مرتبه اول در اندازه گیریهای حرکت بومی را در نظر می گیرد: یک سیستم معادلات overconstrainted، با حداقل مربعات حل شده تا سرعت و مشتقات فضایی آن را بازیابی نماید.

به هرحال، این مدل های بومی تمایل دارند تا به طور ضعیفی، در حضور حرکت های متعدد بین همسایه هایی که روی آنها عمل می کنند، برهم کنش نمایند.

مشکل شکاف ممکن است به طور تجزیه ای با مشتق گرفتن معادله های محدودیت جریان نوری حل گردد تا معادله های شامل مشتقات مرتبه دوم شدت به دست آید. این محدودیت ها، به طور متداول دو یا تعداد بیشتری معادله در دو جزء v  فراهم می نماید، زمانی که غیر یکنواخت، می تواند برای به دست آوردن تخمین های کل حرکت استفاده شود. برای مثال، Uras و همکاران، محدودیت

ترجمه مقاله فیزیک

را استفاده کردند. که منجر به یک بیان تجزیه ای برای هر دو جزء v در یک نقطه تصویر منفرد گردید. Nagel نشان داد که نقاط تصویر با منحنی مرتفع گوسین، مانند گوشه های grayvalue ، به بازیابی سرعت کل به روشی مشابه اجازه می دهد. Haralick و Lee، و Tretiak و Pastor از ترکیب (1.3) و (2.10) برای غلبه بر مشکل روزنه در نقاط تصویر منفرد و برای تخمین سرعت کل استفاده گردند.

شیوه محلی دیگر، که از نیاز برای تخمین مجموع مشتقات شدت دوری می کند، از قضیه ی واگرایی گوس استفاده می کند تا معادله محدودیت جریان نوری به معادله زیر تبدیل نماید:

ترجمه مقاله فیزیک

که S و V، تجمع کلی روی سطح و حجم داده ی شدت را نشان می دهند. اندازه همسایه های سطح و حجم باید برای غلبه بر مشکل روزنه مناسب باشد.

3-1-2- مدلهای سطح

کار پیشرو توسط Longuet-Higgins و Prazdny ، شکل میدان نوری را برای مشاهده گر تک چشمی در صحنه ی سخت آزمایش کردند. آنها معادله ی معروف سرعت تصویر را استنتاج کردند، که حرکت سه بعدی و پارامترهای عمق را به حرکت دو بعدی تصویر مرتبط می کند (تقریب شده به عنوان جریان نوری). آنها نشان دادند که این پارامترها می تواند از جریان نوری و مشتقات مرتبه اول و دوم آن بازیابی گردد.

ترجمه مقاله فیزیک

Longuet Higgins شرایط لازم برای بازیابی حرکت و ساختار، از حرکت سطح صفحه ای را استنتاج کردند. نشان داده شده که دو صفحه با جهت گیریهای سطح متمایز، که در حرکتهای 3 بعدی قرار گرفته اند ممکن است میدان جریان نوری مشابه داشته باشند.  Waxman و Wohn طبیعت دوگانه ی این حرکت و پارامترهای ساختار را شرح دادند: یک مجموعه از پارامترها می تواند از بقیه مشتق شوند. Subbarao و Waxman، نشان دادند که این راه حل ها در طول زمان یکنواخت هستند. Horn ثابت کرد که تفسیرهای متعدد میدان جریان نوری یگانه ایجاد شده توسط سطوح دارای شکل های دلخواه، به ندرت اتفاق می افتد.

تعدادی تکنیک های حرکت صفحه ای وابسته به سرعت نرمال، قابل دسترس گردید. روش تابع سرعت  Waxman و Wohn  فرض کردند که یک سرعت در یک نقطه در سطح منحنی ، می تواند با مجموعه تیلور مرتبه دوم در حدود آن نقطه تقریب زده شود. برای سرعت v= (u, υ) ، به دست آمد:

با استفاده از معادله محدودیت سرعت نرمال، υn= v.n ، یک معادله خطی در دوازده مجهول، دو جزء v و مشتقات مرتبه اول و دوم آنها، به دست آمده است. دوازده یا تعداد سرعت نرمال بیشتری در یک همسایه محلی در سطح منحنی می دهد، این پارامترها می توانند بازیابی شوند. در رخدادی که سطح محلی مسطح می باشد، سپس:

 

به (2.12) اجازه می دهد تا به صورت معادله دارای هشت مجهول نوشته شود. از این رو، تنها هشت سرعت نرمال، لازم است تا سرعت صفحه مسطح را بازیابی نماید.

Murry  و Buxton ارتباط بین پارامترهای نرمال سرعت صفحه مسطح را استنتاج کردند، که به معادله خطی به شکل زیر منجر گردید:

که محورهای c  و p، توضیحاتی برای مختصات تصویر سرعت نرمال ، پارامترهای حرکت 3 بعدی، و سطح نرمال مسطح در بردارند. که هشت سرعت نرمال را به دست می دهد، اجزای p می تواند تعیین گردد و سرعت کل به صورت زیر به دست آمده است:

دستکاریهای ریاضیاتی بیشتر p، معادلاتی برای بازیابی پارامترهای حرکت 3 بعدی و جهت گیری سطح حاصل کرد. اگر مساله روزنه، بر برخی موقعیتهای تصویر در یک همسایه نتواند غلبه کند، اما ان پارامترهای سطح می تواند تخمین زده شود، سپس، بخاطر استفاده از یک مدل سطح، یک سرعت تصویر برای هر یک از این موقعیت ها می تواند استنباط شود. 

 ترجمه مقاله فیزیک

4-1-2- مدل های حدفاصل

برخی روش های دیفرانسیل برای تخمین حرکت تصویر، به حضور حدفاصل یا لبه هاف در توالی تصویر بستگی دارد. مراحل محاسباتی این روش ها، از استخراج حدفاصل های واضح تصویر ، با تکنیک های پیش فیلتر همراه با تخمین دیفرانسیلی حرکت تصویر تشکیل شده است.

ترجمه مقاله فیزیک

 ضرورتا، حدفاصل ها یا لبه ها، نسبتهای سیگنال به نویز قوی نشان می دهند که استخراج آنها را تسهیل می نماید. بعلاوه، اعتقاد متداول بر این است که آنها مسئول ساختارهای تصویر چشمگیر هستند، گرچه این هدف نمی تواند در هر احساس دقیقی پشتیبانی شود. بعلاوه، محاسبه جریان نوری در لبه ها، اغلب منجر به میدانهای جریان پراکنده می گردد. (معمولا %10 میدان یا کمتر، بسته به چگالی لبه ها) .

Hildreth  یک مخدودیت یکنواخت پیشنهاد کرد تا به تخمینهای سرعت نرمال در امتداد حدفاصل های استخراج شده از تصویر متغیر با زمان اعمال گردد. برای حدفاصل S، تخمین های سرعت نرمال باید کمینه شوند:

اگر حداقل دو تخمین سرعت نرمالدر امتداد S متفاوت باشند، سپس کمینه کردن انتگرال فوق، میدان سرعت یکنواخت در حدفاصل S را حاصل می کند (شکل 5-2 را ببینید). به ویژه، تابع

که nˆ محور واحد در جهت عمود بر v، در امتداد حدفاصل ، کمینه شده است. β فاکتور توزیع می باشد و 2(v.n – ǁvǁ2) اختلاف مربعی بین سرعت نرمال تخمین شده و پیش بینی صورت گرفته توسط راه حل را بیان  می کند. Gong و Brady، محدودیت مشابه را فرمول بندی کردند تا کمینه شود که عبارت اختلاف حداقل مربعی برای سرعت مماس را شامل می شود:

 که t محور واحد عمود بر n  و α  اسکالر بیان کننده ی اطمینان همراه با اجزای مماسی v ، متناسب با دترمینان ماتریکس Hessian ساختار شدت زمینه می باشد. آنها نشان دادند که اجزای مماسی v ، هر جا که دترمینان Hessian  غیر صفر باشد، می تواند با اطمینان تخمین زده شود.

Buxton و روش Buxton برای جریان نوری تخمین زده شده، بر اساس مدل حرکت لبه در توالی تصاویر می باشد. آنها توجه کردند که نسبت سیگنال به نویز، در موقعیت های چشمگیر ویژگی های تصویر مانند لبه ها افزایش یافته است. روش آنها که با شواهد روانی فضایی زمانی تصفیه در فرایندهای بصری اولیه ی انسان هدایت شد، توسعه مستقیم اپراتور آشکارسازی لبه مرکز-محیط اطراف Marr و Hildreth می باشد. آنها zero-crossing فضایی زمانی را با مشارکت معادله زیر محاسبه نمودند:

شکل 5-2- اگر حداقل دو تخمین جریان نرمال در امتداد حدفاصل متفاوت باشند، سرعت کل حدفاصل می تواند به طور یکنواخت تعیین شود.

با یک توالی تصویر، که عبارت اول عملگر dAlembert می باشد و عبارت دوم تابع گوسین می باشد، می دهد:

ترجمه مقاله فیزیک

که پارامترهای α و u، گسترش پوشش را کنترل می کنند. سرعتهای نرمال، سپس می توانند در zero-crossing، با محاسبه ی مشتقات جرئی مرتبه اول S(x,t) ، با یک محاسبه حداقل مربعات، تخمین زده شوند

انتخاب برای مقادیر پارامترهای α و u، یک استقرا ایجاد کرده است، در حالی که توزیع لبه ها در تصویر مجهول است.  

Duncan و Chou یک آشکارساز لبه زمانی تعریف کردند که تاثیرات متغیرهای موقت را در روشنایی کمینه می کند. آشکارساز لبه مشتق جرئی مرتبه دوم تابع گوسین می باشد:

که با توالی تصویر در زمان همراه شده تا مجموعه ای از zero-crossing القا شده با لبه های متحرک تولید نماید. نویسندگان به صورت تئوری و تجربی نشان دادند که واریانس روشنایی، در St(x,t) ، zero-crossing ایجاد نمی کند. تمایزهای مرکزی برای تخمین مشتقات مرتبه اول St در همسایه های محلی استفاده شده است. سرعتهای نرمال به صورت زیر محاسبه شده اند:

که هم ارز با معادله ی معول محدودیت جریان نوری می باشد. خطوط تعریف شده با v  ، در ناحیه تصویر محلی تلاقی پیدا کرده اند تا تخمین های سرعت کلی را به دست آورند. آزمایش های موفقی، با تصاویر سنتزی در بردارنده ی متغیرهای چشمگیر روشنایی نشان داده شده اند.

ترجمه مقاله فیزیک

Waxman و همکاران ، فیلترهای فضایی زمانی را به نقشه های لبه اعمال کرده اند تا سرعت را در لبه های استخراج شده با DOG zero-crossing اندازه گیری نمایند. با توج به نقشه لبه دوگانه E(x,t) ، یک پروفایل فعالسازی A(x,t) با هموارسازی نقشه لبه با یک فیلتر گوسین فضایی زمانی ایجاد شده است:

که روش دیفرانسیلی به آن اعمال شده است. در موقعیت های لبه، که پروفایل های گوسین مرکزیت یافته اند، شیب فضایی A باید صفر باشد، و بنابراین یک روش مرتبه دوم سازگار شده است. تخمین های سرعت با معادله ی زیر به دست آمده اند:

که مشتقات A، با ترکیب هسته مشتقات گوسین مناسب با نقشه لبه محاسبه شده است.

یک روش متفاوت برای ردیابی لبه ها با zero-crossing ، استفاده از پیکربندی شعاعی اپراتور DOG می باشد.Perrone چنین مدلی را برای اندازه گیری سرعتهای نرمال لبه های متحرک نشان داد. در پیکربندی شعاعی ، تفاوتهای زمانی در ارتباط با اپراتورها، اطلاعات کافی برای تعیین سرعت نرمال فراهم می کند. یک مدل ثابت، سپس می تواند به توزیع سرعت نرمال اعمال شود تا سرعت کل به دست آید.

5-1-2- روش های چند محدودیتی

روش های چندمحدودیتی، مثال های متعددی از (1.3) یا (2.10) را استفاده می کنند تا بیان غیر مبهم برای حرکت تصویر در نقاط تصویر منفرد فراهم نمایند. Liu و همکاران، معادله (1.3) و (2.10) را استفاده کردند، آنها تصویر فضایی زمانی را با چندجمله ای هرمیت بسط دادند و با استفاده از حداقل مربعات استاندارد، v را حل نمودند.

ترجمه مقاله فیزیک

باقی مانده تناسب (fit)، تعداد شرایط و دترمینان ماتریک حداقل مربعات، به عنوان اندازه گیری قابل اطمینان در میدان جریان نوری نهایی عمل می کند. سیستم های overconstrainted معادله ها، همچنین می توانند به منابع نوری متعدد، یا با استفاده از تصویر به دست آمده با حسگرهای بصری که به نواحی متعدد طیف نوری تنظیم شده اند، به دست آیند. تصاویر طیفی ، آنهایی را که در طیف مرئی (3 صفحه رنگی) و زیر قرمز هستند شامل می شود. Makandey و Flinchbaugh، نشان دادند که روش چند طیفی آنها، برای داده تصویر سنتزی و یک صحنه ی بیرونی، دقت مشابه با الگوریتم Horn and Schinck تولید کرده است.

توابع دیگر (یا ترکیب با) شدت ممکن است در معادله محدودیت جریان نوری جایگزین شود تا سیستم های overconstrained حاصل گردد. این توابع می توانند چنین فرض شوند که خروجی عملگرهای اعمال شده به شدت های تصاویر هستند.

ترجمه مقاله فیزیک

برای مثال، پاسخ جفت خطی فیلتر مستقل می تواند همراه با معادله محدودیت جریان نوری برای این هدف استفاده شود. Mitiche و همکاران، از یک سیستم overconstrained  معادله های ایجاد شده از معادله محدودیت جریان نوری، برای نقطه ی مشابه در تعدادی تصاویر متفاوت استفاده کردند، که از معادله اصلی مشتق شده بود، و با اعمال توابع برای محاسبه ی   مقادیر محلی کنتراست، میانگین، واریانس، آنتروپی، میانه و توان ایجاد شده بود. Srinivasan یک روش مشابه را با استفاده از سیستم overconstrained معادلات مشتق شده از تصاویری پیشنهاد کرد که با اعمال شش فیلتر فضایی زمانی اختصاصی روی تصویر اصلی ایجاد شده بودند. به هرحال، مساله روزنه، هنوز هم، زمانی که با یکتایی سیستم overconstrained معادلات مواجه می شود، نمی تواند حل گردد: این امر برای ساختارهای شدت ویژه اتفاق می افتد، که نواحی شدت یکنواخت، ساختارهای مرتفع یا بافت های دوره ای و …  را شامل می شوند.

6-1-2- روش های سلسله مراتبی

روش های جریان نوری متفاوت، به دلیل سرعت نمونه برداری کم، مشکلاتی را با حرکات دو بعدی بزرگ نشان دادند، بنابراین تئوری نمونه برداری Shannon را نقض کردند. به کار بردن روش های متفاوت به حالت بزرگ به کوچک، چنین مشکلاتی را کاهش می دهد.

ترجمه مقاله فیزیک

پیچش تصویر، ممکن است برای حفظ تصویر با ثبت کافی در مقیاس مطلوب استفاده شود، بنابراین تمایز عددی می تواند انجام شود. چارچوب سلسله مراتبی  Bergen و همکاران روش های متعدد جریان نوری را یکنواخت می سازند.

ترجمه مقاله فیزیک

با استفاده از یک مدل پارامتری بر اساس تحولات affine، سختی صحنه، مسطح بودن سطح یا حرکت عمومی در یک ناحیه ی تصویر که اجازه می دهد تا هردو کیفیت تناسب به داده (شاید اگر لازم باشد ناحیه را تقسیم نمایند) و به انباشتن در میدان های جریان نوری پراکنده با پارامترهای محاسبه شده را قضاوت نمایند.

ترجمه مقاله فیزیک

قالب های سلسله مراتبی مبتنی بر دیفرانسیل توسط Glazer، Enkelmann، و Battiti و همکاران پیشنهاد شده اند. علاوه بر این، Bergen و همکاران نشان داده اند ک بسیاری از مدل های حرکت باید از طریق یک چارچوب سلسله مراتبی توضیح داده شوند. روش های سلسله مراتبی سازگار با توجه به مقیاس ظاهر شده اند.

2-2- روش های مبتنی بر فرکانس

دسته ی دوم تکنیک های بر اسای استفاده از فیلترهای تنظیم شده با سرعت می باشد. این تکنیک ها ، جهت گیری حسگرهای حساس در ناحیه فوریه تصویر متغیر با زمان را استفاده می کنند.

از میان فواید این روش، چنین فهمیده می شود که مکانیسم های حساس به حرکت که در انرژی دارای جهت گیری فضایی زمانی در فضای فوریه عمل می کنند، می توانند در سیگنالهایی که روش های تطابق شکست خواهند خورد، حرکت را تخمین بزنند. برای مثال، حرکت الگوی نقطه ای تصادفی، ممکن است برای ضبط با روش های مبتنی بر ویژگی یا مبتنی بر همبستگی مشکل باشد در حالی که در فضای فوریه، انرژی جهت گرفته ی حاصل  ممکن است برای محاسبه حرکت به راحتی استخراج گردد.

انتقال فوریه ی انتقال دو بعدی سیگنال شدت اختصاصی شده در (1.1) به شکل زیر است:

که(k)  0Î انتقال فوریه  I (x,0) می باشد و x موقعیت فضایی را نشان می دهد. δ تابع دلتای دیراک می باشد و k, ω فرکانس فضایی زمانی را نشان می دهند. این معادله محدودیت جریان نوری را در فضای فرکانسی نتیجه می دهد:

که نشان می دهد سرعت انتقال الگوی دو بعدی تابعی از فرکانس فضایی زمانی آن است و ازطریق مبدا فوریه فضایی یک صفحه تشکیل می دهد.

ترجمه مقاله فیزیک

1-2-2- فیلتر کردن با جهت گیری انتخابی

Adelson و  Bergen یک دسته از طرح های محاسباتی را پیشنهاد دادند که که این حقیقت را روشن کرد که حرکت تصویر آشکار شده هم ارز با جهت گیری فضایی زمانی استخراج شده می باشد. فیلترینگ Gobar ، یک تکنیک برای استخراج انرژی فضایی زمانی نشان داده است. یک فیلتر Gobar، یک تابع گوسین است که با سینوس یا کسینوس موج ضرب شده است. به عنوان مثال، تابع

فیلتر Gobar سینوس 3 بعدی(فرد) می باشد، که (k, ω) فرکانس مرکزی است که قله های دامنه را پاسخ می دهد. Adelson  و Bergen خاطر نشان کردند که الگوی پاسخ چنین فیلترهایی توسط کنتراست سیگنال تحت تاثیر قرار می گیرد: تحریک با کنتراست پایین ، دامنه پاسخ پایین ایجاد می کند و برعکس. در حالی که اندازه گیری سرعت مستقل از دامنه های کنتراست می باشد، حدس زده می شود که از نسبتهای پاسخ فیلترهای مختلف برای استخراج تخمین های سرعت استفاده می شود.

ترجمه مقاله فیزیک

John نشان داد که آشکارسازی جهت گیری فضایی زمانی شبیه آنالیز مقدار ویژه ی تانسور اینرسی می باشد. به عنوان مثال، یک نقطه در مبدا فضای فوریه به ناحیه ی شدت ثابت مربوط است  و به مقدار ویژه ی صفر در فضای تنسور مربوط است. همچنین، یک خط در فضای فرکانس، یک الگوی دارای جهت گیری فضایی است که با سرعت ثابت حرکت می کند و سرعت نرمال آن می تواند با محور ویژه ی مربوز به مقدار ویژه صفر به دست آید.

ترجمه مقاله فیزیک

نهایتا، یک صفحه در طول مبدا، یک الگوی توزیع فضایی را نشان می دهد که با سرعت ثابت و محور ویژه، همراه با  با مقدار ویژه ی ماکزیمم تنسور اینرسی حرکت می کند، که سرعت کل الگو را به دست می دهد. از این رو، Johne استفاده از آنالیز تنسور اینرسی را برای آشکارسازی جهت گیری فضایی زمانی، و دوری از بسط محاسباتی ناشی از تعداد زیادی فیلترهای دخیل در روش های Heeger و  Fleet پیشنهاد کرد. به هر حال، این اگوریتم تنها روی داده تصویر شبیه سازی شده تست شده بود.

ترجمه مقاله فیزیک

کار Barman و همکاران مشابه کار Jahne می باشد، همانطور که آنها از فیلترینگ فضایی زمانی برای بازیابی سرعت ( و تفاوت عمق کوچک در مورد فضای حرکت) و همچنین شتاب استفاده کردند. یک تنسور از پاسخ شش یا تعداد بیشتری فیلتر مربعی محاسبه شده است، که ب طور مساوی در یک نیمه از فضای فوریه گسترش یافته اند.

ترجمه مقاله فیزیک

مقادیر ویژه و محورهای ویژه تنسور اجازه می دهد تا تعیین شود که در صورت امکان کدام یک از چندین فرمول می تواند برای محاسبه سرعت کل یا نرمال استفاده شود. شتاب دهی ممکن است به عنوان منحنی فضایی زمانی سطح در فضای فرکانس بازیابی گردد.ترجمه مقاله فیزیک

اغلب این تکنیک های مبتنی بر فرکانس، به عنوان مدل های بیولوژیکی حسگر حرکتی انسان نمایش داده شده اند: Watson و Ahumada یک مکانیسم جهت-گزین تعریف کرده اند که با اندازه های روانی جیگر حرکتی انسان سازگار است.

مکانیسم آنها از ترکیبی از توابع فضایی دو بعدیGobar و فیلترهای 1 بعدی زمانی هماهنگ شده با جهت گیری های متعدد برای تخمین سرعت تصویر بومی استفاده می کند. یکپارچگی پاسخ های این حسگرها، اندازه گیری های محلی را مانند هر سنسور در یک گروه جهت دار متمایز می کند که اجزای خطی مستقل محور سرعت را فراهم می کند.

ترجمه مقاله فیزیک

 Grzyywacz و Yuille همچنین یک مدل مبتنی بر فرکانس حسگر حرکت بصری را پیشنهاد داددن. مدل آنها فیلترهای Gabor 3 بعدی جهت گزین استفاده کردند تا انرژی حرکتی را در فضای فرکانس اندازه گیری نمایند. تخمین های سرعت همچنین با یکپارچه سازی پاسخ های جمعیت فیلترها در یک پایه ی محلی به دست آمده اند.ترجمه مقاله فیزیک

2-2-2- فیلترینگ فازی

روش توسعه یافته توسط Fleet  و Jepson سرعت جزء را از لحاظ حرکت آنی کانتور فاز سطح در خروجی فیلترهای Gabor سرعت موزون band-pass تعریف می کند. این فیلترها برای تجزیه ی سیگنال ورودی مطابق با مقیاس، سرعت و جهت استفاده می شوند. هر خروجی فیلتر دارای مقدار پیچیده است و می تواند به صورت زیر تعریف شود:
که ρ(x,t) و ф(x,t) دامنه و بخش فازی سیگنال خروجی هستند. جزء سرعت دو بعدی در جهت نرمال تا سطح فاز کانتور با عبارت زیر داده شده است:

Фt (x,t) مشتق زمانی فاز و (x,t)ф    شیب فضایی آن می باشد. مشتقات فازی با استفاده از عبارت زیر محاسبه شده است:

که R*  کمپلکس مزدوج R(x,t) است ،R(x,t)  شیب R(x,t) می باشد و Im بخش موهومی عدد کمپلکس را نشان می دهد. Fleet و Jepson سرعت را، به دلیل شدت نسبی سیگنال فاز به تغییرات دامنه به دلیل تغییرات در روشنایی صحنه به اطلاعات فاز محلی ربط دادند. این اختلافات اغلب توالی هندسی انعکاس منظره می باشد.

ترجمه مقاله فیزیک

جزء سرعت می تواند از خروجی هر شبکه موزون سرعت به دست آید، در شرایطی که سیگنال فازی پایدار است. معمولا، ناپایداری همراه با همسایه های یکتایی فاز می باشد که می تواند با یک وضعیت محدود کننده ی مسافت بین فرکانس آنی آشکار شود و فرکانس موزون کننده ی پیک  فیلتر باید کمینه باشد.

ترجمه مقاله فیزیک

چنین محدودیتی، زمانی که مشاهده شود، کافی است تا از تخمین سرعت در فاز یکتایی دوری شود. زیرا هر شبکه مستقل در نظر گرفته می شود، ممکن است اندازه گیریهای متعدد  در موقعیت تصویر منفرد جود داشته باشد.

ترجمه مقاله فیزیک

سپس، اگر تعداد تخمین های کافی وجود داشته باشد، سرعت  کل در یک نقطه منفرد یا در همسایه ی کوچکی با حل کردن سیستم خطی معادلات، که اندازه گیری ها را به یک مدل affine جریان نوری مرتبط می کند، بازیابی می شود. همانطور که اکنون فرمول بندی گردید، روش Fleet و Jepson اندازه های مطمئنی فراهم نمی کنند.

همچنین نیاز برای تعداد زیادی از فیلتذها وجود دارد تا فضای فرکانس را پوشش دهد. همچنین مهم است دقت شود که اطلاعات فاز محلی در عمق برای اندازه گیری اختلاف تصویر توسط Jenkin و  Langley و همکاران استفاده شده است. Weng نشان داد که بخش فازی یک سیگنال در شبکه فرگانس ویژه ، اطلاعات کافی فراهم می کند تا سیگنال بین ثابتهای چندگانه را بازسازی نماید. فاز فوریه پنجره ای ، به عنوان همبستگی اولیه در الگوریتم انطباق Weng استفاده شده است.ترجمه مقاله فیزیک

برای تغییر روشنایی صحنه، فاز بسیار قویتر از مشتقات شدت یا پاسخ های فیلتر انرژی می باشد. این می تواند به طور مستقیم با در نظر گرفتن یک سیگنال از A cos(ωt+ф) مشاهده  گردد. تغییر دادن دامنه، A، از سیگنال، می تواند مقدار مشتقات یا پاسخ فیلتر انرژی (دامنه-مربع)   آن را تغییر دهد اما تاثیر کمی روی فاز سیگنال یا مشتقات آن خواهد داشت. روش های مبتنی بر فاز، همچنین به سرعت های جزئی حرکتف به دلیل انسداد یا شفافیت پاسخ خواهند داد، گرچه، یک روش مناسب یکپارچگی اندازه گیری مانند مدل سرعت مختلط، لازم است تا آنها را در سرعتهای کل صحیح دسته بندی نماید. نوعا، روش های مبتنی بر فرکانس، ابزاری برای اطمینان دادن به سرعتهای محاسبه شده فراهم نمی کنند. آستانه ممکن است فراهم شود اما استفاده آن دوگانه است، همانطور که سرعت در یک موقعیت تصویر یافت شده یا در موقعیتی دیگر چنین نیست.

3-2-2- روش های سلسله مراتبی

Heeger یک مدل محاسباتی برای  تخمین سرعت ارائه داد که از جفتهای متعامد فیلتر فضایی زمانی Gobar استفاده می کند. خانواده ی فیلترهای انرژی Gobar، به باند فرکانس فضایی یکسان موزون شده اند، اما برای جهت های فضایی متفاوت تعریف شده است. بزرگی هماهنگی فرکانس فضایی بنابراین ثابت است و مجموعه های دیگر فیلترها می تواند برای شبکه های فرکانسی متفاوت طراحی گردد. به هرحال، یک مجموعه از چنین فیلترهایی می تواند از طریق هرم گوسین مرتب شود تا شبکه های مختلف را پوشش دهد. برای انتقال الگوی دو بعدی، پاسخ های این فیلترها  پیرامون یک صفحه در فضای فرکانسی متمرکز شده اند. تئوری Parsevals برای مشتق گرفتن از پاسخ های مورد انتظار Ri(v) فیلترهای انرژی Gobar برای یک محرک انتقالی استفاده شده اند:

که

که متغیرهای σx و σy انحرافات استاندارد فیلترهای Gabor هستند. اگر mi انرژی اندازه گیری شده برای i و mi‾ و Ri‾ مجموع mi و Ri   ،  متعلق به مجموعه فیلترهای Mi  دارای  جهت گیری فضایی یکسان مانند فیلتر i ام باشند :

سپس یک راه حل حداقل مربعات غیر خطی برای v که اختلاف بین انرژی های پیش بینی شده و  اندازه گیری شده را کمینه می کند،

باید تخمین صحیح برای v را حاصل نماید. اندازه های معینی برای تخمین های سرعت به عنوان چگتای احتمالات مشروط بیان شده است. روش کارایی محاسباتی مشارکت فیلترهای Gabor ، خواص جدایی پذیری آنها را استنباط می نماید ، که همچنین توسط Heeger نشان داده شده است.

ترجمه مقاله فیزیک

3-2- روش های مبتنی بر همبستگی

اختلافات عددی گاهی اوقات، به دلیل پشتیبانی زمانی کم (فقط تعداد کمی فریم) یا نسبت ضعیف سیگنال به نویز ، غیر کاربردی هستند. در این موارد، شیوه های دیفرانسیلی یا فرکانسی ممکن است مناسب نباشد و طبیعی است که مدلهای انطباق در نظر گرفته شود.

1-3-2-انطباق مبتنی بر همبستگی

نوعا، ویژگی های خوب، قابل انطباق، مانند نقاط گوشه پراکنده هستند در حالی که ویژگی های ضعیف و ناسازگار ماند لبه ها چگالتر هستند. حتی زمانی که ویژگی های یکنواخت منطقی در دسترس هستند، ایجاد ارتباطات صحیح می تواند مشکل ساز باشد. همچنین موارد پیچیده بیشتر، انسداد ویژگی هایی است که ممکن است به خطاهای انطباق منجر گردد.ترجمه مقاله فیزیک

شیوه های انطباق مبتنی بر همبستگی، دارای حساسیت کمتری نسبت به این مشکلات می باشند: آنها به حضور ویژگی های تصویر چشمگیر بستگی ندارند و اندازه های پنجره ی همبستگی متغیر می تواند در نزدیکی مرزهای انسداد مورد استفاده قرار بگیرد تا حرکت های چندگانه را کنترل نماید.

ترجمه مقاله فیزیک

این روش ها، جابجایی را (که یک تقریب برای سرعت است) به عنوان یک شیفت تعریف می کند که تناسب خوبی بین نواحی تصویر متغیر با زمان پیوسته را حاصل می کند. بیشتر این روش ها، از محاسبات عمقی نشات می گیرند، که که وظیفه آن مرتبط کردن نواحی تصویر جفت تصاویر گرفته شده از موقعیت های دید متفاوت، زیر نورافکن پرسپکتیو می باشد.

ترجمه مقاله فیزیک

چنین فرض می شود که ، حداقل به صورت محلی، انحرافات ایجاد شده در زاویه ی دید ناچیز هستند. نواحی تصویر منطبق، به مقدار بیشینه ی کردن یک اندازه مشابه هستند. به ویژه ضریب همبستگی بین دو تابع f و g ، به عنوان انتگرال حاصل آنها تعریف شده است:

پیدا کردن δx که مقادیر این انتگرال را برای یافتن شیفت بین f و g بیشینه می کند ، اگر

 f(x+ δx)= g(x) باشد.ترجمه مقاله فیزیک

Kories و Zimmerman  اپراتور یکنواخت برای انطباق نواحی تصاویر در تصاویر همسایه استفاده کردند. اپراتور یک پنجره ی 3*3 است که در آن grayvalue مرکزی با همسایه های خود مقایسه شده و مطابق با تعداد grayvalue هایی که مقدار کمتری از (grayvalue) مرکزی دارند دسته بندی شده است. 

ترجمه مقاله فیزیک

فرایندهای انطباق، با ترکیب اولیه ی grayvalue های اولیه ی که دسته ی یکسانی را به اشتراک می گذارند، پیش می روند.

مرکز نواحی grayvalue به اشتراک گذارنده ی دسته های مشابه، سپس توسط الگوریتم همبستگی ساده ردیابی می شود تا تخمین های فاقد  شباهت را ایجاد نماید.

Sutton و همکاران یک روش همبستگی پیشنهاد کردند که به تخریب غیر خطی نواحی تصویر کوچک اجازه می دهد. بازسازی دوخطی سطح شدت برای نواحی تصویر محلی Ωi محاسبه شده است . جابجایی چنین سطح شدت تحت تخریب خطی به صورت زیر بیان شده است:

که x́Ωi موقعیت همسایه ی تخریب شده ی Ωi  ،dΩi  پارامترهای تخریب و d شیفت Ωi در واحد زمان می باشد. یک ضریب همبستگی

که اختلافات مربعی همسایه های  Ωi و Ώi را شرح می دهد، با تحقیق در ناحیه ی حرکت برای مقادیر dΩi  وdΩi  کمینه شده است. تخمین های برای این شش پارامتر باید به صورت تکرار پذیر به دست آید، به صورت غیر مشابه به راه حل های C که نشان داده شده است.

یک روش انطباق ناحیه که به تخریب شدت اجازه میدهد توسط Kalivan و Sawchuk نشان داده شده است. یک تابع هدف که از لحاظ جابجایی میدان تحت یک انتقال affine تعریف شده است،در تمامی تصویر کمینه شده است.ترجمه مقاله فیزیک

برای دوری از بسط محاسباتی کمینه سازی های تکراری توابع، Little و همکاران پیشنهاد کردند که استفاده از نواحی دارای همپوشانی جزئی برای انطباق، برای تخمین یک عبارت یکنواختی ایزوتروپیک اعمال شده روی تخمین های غیر مشابه، کافی است. تقریب توابع آنها

 

که ф اپراتور همبستگی می باشد، نشان داده شده تا به عنوان حد ناحیه ی انطباق که بزرگتر می شود، تصحیح گردد.ترجمه مقاله فیزیک

2-3-2- روش های سلسله مراتبی

در حضور اختلافات زیاد، الگوریتم های همبستگی غیر سلسله مراتبی، به دلیل افزایش در فضاهای تحقیق مورد نیاز برای کنترل حرکت سریعتر، به انطباقات نادرست حساس شدند. علاوه بر این، همبستگی نواحی تصویر، به طور عمومی، به طور محاسباتی متمرکز است.

ترجمه مقاله فیزیک

به منظور کاهش مقدار محاسبات و پتانسیلهای عدم انطباق، فرد ممکن است از تخمین بزرگ حرکت برای جهت دادن به فرایندهای انطباق استفاده نماید. الگوریتم های Ogata و Sato ، محاسبات همبستگی با تخمین های بزرگ حرکت به دست آمده از فیلترهای موزون سرعت Gabor را فراهم نمودند. این تخمین ها می تواند برای محدود نمودن اندازه های نواحی تحقیق استفاده گردد و در نتیجه تعداد محاسباتی که معمولا برای به دست آوردن اختلافات لازم است را کاهش دهد.

اندازه پنجره های همبستگی یک پارامتر مهم برای انطباق نواح می باشد. به عنوان مثال، بین یک پنجره همبستگی، باید تغییرات سیگنال کافی وجود داشته باشد تا به طور قابل اطمینانی اختلاف را تعیین نماید.

ترجمه مقاله فیزیک

به هرحال، تغییر اختلاف بین پنجره مشابه، باید به عنوان انطباقات محلی عمل کننده تحت فرضیه مدل سرعت ثابت، ناچیز باقی بماند. اندازه پنجره ی بهینه سپس به ساختار سیکنال زمینه بستگی دارد. Okutomi و Kanade یک مدل استاتیکی اختلاف بین پنجره های همبستگی  پیشنهاد کردند که فرض می کند که مقادیر اختلاف ثابت هستند اما عدم قطعیت افزایش یافته نشان می دهد، همانطور که آنها دورتر از نقطه مرکزی پنجره هستند. این مدل، یک رابطه بین اندازه پنجره و عدم قطعیت اختلاف ایجاد می کند.  این ارتباط اجازه می دهد تا فرد، عدم قطعیت اندازه گیری ها را با تنظیم اندازه ی پنجره همبستگی کمینه نماید.  

تکنیک های انطباق سلسله مراتبی می توانند دقت اختلاف را با عمل کردن روی شبکه های فرکانسی متعدد استخراج شده از تصاویر بهبود دهند تا پردازش گردند. شبکه های فرکانس پایین برای تخمین اختلافات بزرگ استفاده شده اند که می توانند با افزودن شبکه های فرکانس بالا به فرایندهای انطباق تصفیه شوند.

ترجمه مقاله فیزیک

روش Anandan، بر اساس هرم لاپلاسین و یک استراتژی انطباق بزرگ به کوچک مبتنی بر SSD می باشد. هرم لاپلاسین ، اجاز می دهد تا اختلافات بزرگ داخل فریم تخمین زده شود و کمک می کند تا ساختار تصویر مانند لبه ها افزایش یابد، که گمان می شود که برای انطباق مهم باشد( شکل 4-1 و 6-2 را ببینید).  اندازه SSD (مجموع اختلافات مربعات) به صورت زیر تعریف شده

 

که W(i,j) تابع وزنی را نشان می دهد و d به همسایه های مربعی اندازه (2n+1)2  که در x مرکزیت یافته ، محدود شده است. در سطوح بزرگتر، جابجایی های صحیح چنین فرض می شود که یک واحد فضایی برای هر فریم یا کمتر باشد. حداقل SSD، ابتدا به دقت عدد صحیح بین نواحی تصویر کوچک قرار گرفته است. جابجایی های زیر پیکسلی سپس با یافتن حداقل تقریب های مربعی به سطح SSD در مورد موقعیت عدد صحیح محاسبه شده اند که به خوبی S(x,d) را کمینه می نماید. اندازه های انطباق از انحنای اصلی سطح SSD مشتق شده اند و به عنوان وزن در توابع زیر استفاده شده اند:ترجمه مقاله فیزیک

 

که باید در تمامی ناحیه سرعت تصویر D کمینه گردد. êmax و êmin جهت های نرمال شده اصلی منحنی کمینه و بیشینه می باشد.   d0 جابجایی به دست آمده با مینیمم کردن S(x,t) در هرم لاپلاسین را نشانمی دهد (معمولا سه سطح استفاده شده اند.). در سطح بزرگتر، که حرکت بزرگتر کمتر از یک واحد فضایی به ازای هر فریم می باشد،

حداقل SSD به دقت زیر پیکسل با یافتن مینیمم سطح همبستگی SSD قرار گرفته است  و با استفاده از معادلات تکرار پذیر مبتنی بر (38-2) یکنواخت شده است. سپس با استفاده از طرح بازتابی همپوشانی یافته ، این جابجایی ها به سطح بعدی در هرم منعکس شده اند. انطباق و یکنواختی به این حالت در هر سطح هرم ، از سطح بزرگ به کوچک انجام شده است، تصویر اصلی ، میدان جریان نوری نهایی را نتیجه می دهد.

روش Singh مشابه روش Anandan است  که از مینمیم های SSD و یک محاسبات دو مرحله ای استفاده می کند. مرحله اول از محاسبه مقادیر SSD با سه تصویر همسایه فیلتر شده high-pass ، I1  ، I0 و I 1 تشکیل شده است. سطح SSD سه فریمی به صورت زیر محاسبه شده است:

سطح S سپس به احتمال توزیع تبدیل شد، به صورت زیر تعریف شد:

که

شکل 6-2- تجزیه تصویر سلسله مراتبی: تصویر اصلی در مجموعه سلسله مراتبی شبکه های فرکانسی قبل از تخمین جریان نوری تجزیه شده اند.

تخمین سرعت dc با محاسبه میانگین وزنی ، با استفاده از  مقادیر Rc(d) برای یک ناحیه تصویر داده شده به دست آمده است. ماتریس های کوواریانس Sc همراه با اختلافات dc محاسبه شده اند. 

مرحله دوم الگوریتم singh ، سرعت را با استفاده از محدودیت یکنواختی همسایه منتشر می نماید. دوباره، یک شیوه میانگین وزنی در محاسبه da، یک میانگین dc روی نواحی تصویر کوچک استفاده شده است. dc و da سپس برای ایجاد یک ماتریکس کوواریانس Sn بکار رفته اند. میدان اختلاف صحیح توابع زیر را مینیمم می سازد
که نیازهای میدان اختلاف سراسر D را که به آرامی تغییر می کند را بیان می نماید. مقادیر ویژه ی λ1 و λ2  ماتریکس [Sn+Sc]1 به عنوان اندازه های اطمینان برای تخمین عمل می نمایند.

ترجمه مقاله فیزیک

Singh استفاده از هرم لاپلاسین با استراتژی بزرگ به کوچک را در [8] توصیه می کند تا سرعتهای بزرگ را تخمین بزند. علاوه بر این، چارچوب Sing با روش فیلتر Kalman توسعه یافته بود تا تخمین های حرکت را در طول اندازه ای اطمینان انها ثبت نماید و اندازه گیری های جدید  با تخمین های موجود را مرتبط سازد.

4-2- مدلهای حرکت متعدد

پدیده های زیادی می توانند حرکتهای متعدد تصویر را سبب شوند. از بین انها، انسداد و شفافیت از لحاظ دقت و اهمیت آنها در تصاویر واقعی مهم می باشند.

ترجمه مقاله فیزیک

بعلاوه، محتوی اطلاعات آنها برای مراحل بعدی پردازش مهم می باشد، مانند قطعه بندی حرکت و بازسازی 3 بعدی سطح. مرزهای انسداد با انسداد جزئی سطح با دیگری شرح داده شده است، در حالی که شفافیت به عنوان انسداد سطح با مواد نیمه شفاف تعریف شده است. در تصاویر واقعی، دریافتند که انسداد باید علت مکرر حرکت ناپیوسته باشد.ترجمه مقاله فیزیک

در بین محدودیت های ذاتی روش های مبتنی بر شیب، نیاز ساختارهای شدت مشتق پذیر ، در سراسر ناحیه تصویر شاید بسیار  محدود کننده باشد.

در ناپیوستگی های تصویر، که بسیاری از حکتها باقی می مانند، استفاده از (3-1) مشکل ساز گردید، در حالی که مشتقات شدت تئوری موجود نبود. بعلاوه، تکنیک های همبستگی موجود، به انسداد حساس هستند، مانند ساختار تصاویر نزدیک مرزهای انسداد ممکن است در زمان ظاهر یا ناپدید گردند، که احتمالا منجر به عدم انطباق خواهند شد.

ترجمه مقاله فیزیک

بعلاوه، محدودیت های جریان نوری، مانند (3-1) و روشهای همبستگی محلی اغلب با نیازهای جهانی جفت شده اند، که یک پیوستگی فضایی در جریان نوری را ایجاد می نمایند. قابل مشاهده است که چنین نیازهای ایزوتروپیکی در حالت کلی رضایتبخش نیست، همانطور که اغلب تصویر ناپیوستگی های حرکتی را در بر دارد.ترجمه مقاله فیزیک

1-4-2- فرآیندهای خط

معادله های دیگری که برای تخمین ناپیوستگی حرکت تلاش می کنند ، توسعه یافته اند. یک استراتژی برای کنترل انسداد، استفاده از فرایندهای خطی دوگانه را شامل می شود که به طور واضح ناپیوستگی شدت ها را مدلسازی می کند. Koch و همکاران ، انطباق محدودیت های یکنواختی در پیکسل های دارای مقادیر شیب فضایی زیاد ، آسان می نمایند. این امر، از یکنواختی در ناپیوستگی ها و فرضیات جلوگیری می کند که ناپیوستگی تتصویر در موقعیتهای مشابه مانند ناپیوستگی شدت اتفاق می افتد. Black همچنین نشان داد که چگونه فرایندهای خطی باید در چارچوبی قوی استفاده شوند ( مشابه فیلتر Kalman).

بازدارندگی غیر-دوگانه یکنواختی در سراسر کانتورهای شدت، توسط Nagel پیشنهاد شد. این روش، مبتنی بر مینیم کردن توابع

می باشد که

 مقادیر (uxIy-uyIx)2 + (υxIyyIx)2،  که  تغییرات فضایی V در جهت عمود بر شیب تصویر را نشان می دهند، در سراسر کانتورهای شدت مینیمم شده اند. این توابع، به عنوان محدودیت یکنواخت جهت دار شناخته شده اند.

روش مینیمم سازی می تواند با استفاده از اختلافات محدود یا اجزای محدود اجرا شود. این روش یکنواختی جهت دار اخیرا تا ناحیه ی زمانی گسترش یافته است. روش مشابهی که از روش یکنواخت وزن یافته با شدت استفاده می کند، توسط Aisbett نشان داده شده است.

این روش، با بازدارندگی یک محدودیت یکنواختی ایزوتروپیک، برای نواحی تصویر محتوی تغییرات شدت چشمگیر مشخص شده است. 

ترجمه مقاله فیزیک

در مقابل روش Nagel، بازدارندگی محدودیت یکنواختی جهت دار نیست. بعلاوه، شدتهای تصاویر مشتق پذیر فرض می شوند و ناحیه ی کاربرد الگوریتم به طور واضح برای تصویر محدود شده است که این نیاز را مطلوب می نماید.

منحنی های مشابه ممکن است برای جداکردن نواحی تصویر نشان دهنده سرعتهای متفاوت استفاده شود. Schnorr یک روش پیشنهاد کرد که از تعریف چنین منحنی تشکیل شده است، یک ناحیه دلخواه پیرامون ناحیه ای که وجود یک شیء متحرک مستقل فرض می شود را محدود می کند، بنابراین دو ناحیه ی Ωi و Ω0 را ایجاد می نماید. با توجه به میدان های سرعت  vi و v0 ، منحنی های نزدیک تعریف کننده ی دو ناحیه ، به طور تکرار پذیر با مینیمم کردن تابع زیر تصفیه شده اند:

که f= (v̂i– vi)2  ، g= (v̂0-v0)2  و v̂i و v̂0 به ترتیب سرعتهای اندازه گیری شده بین Ωi  و Ω0 می باشند. به هرحال، با فرض دانش قبلی در مورد موقعیت شیء متحرک مستقل، عمومیت این روش را محدود می کند.ترجمه مقاله فیزیک

2-4-2- توزیعات سرعت مختلط

استراتژی دیگر برای تخمین جریان نوری ناپیوسته، روشن ساختن یک مدل برای توزیعات سرعت مختلط (معمولا دو تا) در هر نقطه تصویر می باشد. یک روش تخمین حرکت ناپیوسته در یک اساس محلی، توسط Schunk نشان داده شده، که از معادله محدودیت جریان نوری (1.3) برای محاسبه خطوط محدودیت متعدد در فضای سرعت برای همسایه های فضایی کوچک استفاده می نماید.

ترجمه مقاله فیزیک

دسته های تقاطع این خطوط با خط محدودیت نقطه مرکزی همسایه، برای تعیین دسته ی کوچک در بردارنده ی حداقل نصف تقاط تقاطع آنالیز شده اند. نقطه میانی این دسته ها بنابراین حرکت تخمین v را تعیین می نماید. اگر دو الگوی حرکتی بین همسایه نشان داده شود، سپس v، به عنوان غالب در نظر گرفته شده است.

به هرحال، اندازه های همسایه باید تغییرات چشمگیر خط محدودیت را شامل شوند، همانطور که یافتن تقاطع خطوط محدودیت ممکن است نامرغوب گردد، به عبارت دیگر (این به سادگی آشکار شدن مشکل روزنه دیگر می باشد). مدلهای مختلط Jepson  و Black  از این روش تبعیت می کند، اما از چارچوب تخمین قوی استفاده می کند.

ترجمه مقاله فیزیک

شکل 7-2- خط محدودیت از نقطه مرکزی ناحیه تصویر، متقاطع با خطوط محدودیت نقاط تصویر همسایه در نظر گرفته شده است. دسته های تقاطع اجازه می دهد تا الگوی سرعت غالب تعیین شود.

زمانی که حرکتهای متعدد از یک ناحیه  تصویر ناشی می شود، راه حل حداقل مربعات برای خط محدودیت جریان نوری مشکل خوشه، منجر به تخمین میانگین این حرکتهای چندگانه می گردد.

ترجمه مقاله فیزیک

با توجه به این مشکل، Black مشکل تخمن جریان نوری را با استفاده از تخمین گرهای تنومند ، دوباره فرمول بندی نمود. این چارچوب از مینیمم سازی یک تابع تشکیل شده که فرضیات گوناگون ساخته شده در مورد حرکت تصویر را بیان می کند:

که ED(v) معادله محدودیت جریان نوری می باشد،  Es(v) محدودیت ارتباط فضایی (عبارت یکنواختی فضایی) و ET(v, v̄)  محدودیت ارتباط زمانی می باشند:
v̄ یک پیش بینی در مورد v در زمان t+1 می باشد. ρD ، ρS و ρT ، robust، Lorentzian M-estimators هستند. استفاده از آنها ، با این حقیقت که توزیع حرکتهای متعدد بین یک ناحیه تصویر منفرد گوسینی نیست، و به حساب  رخداد های مدلسازی نشده به وسیله ی فرضیات ثبات روشنایی پیش میرود.

ترجمه مقاله فیزیک

قدرت این تخمین گرهای آماری، با شدت نسبی آنها به انحرافات از مدل آماری فرض شده در مجموعه اندازه گیریها مشخص شده است، که به تخمین ناپیوستگی جریان نوری اجازه می دهد (شکل 3-2 را ببینید).

شکل 8-2-  a) سمت چپ: تناسب حداقل مربعات در میان ابر نقاط. b)سمت راست:  تناسب قوی در میان ابر نقاط مشابه. تابع تاثیر توزیع احتمالات Lorentzian ، تمایل به سرعت صفر برای انحراف از میانگین دارد. اینها به عنوان پرت (داده ی پرت) در نظر گرفته می شوند.

الگوهای متعدد حرکت بین یک ناحیه تصویر منفرد ، از شفافیت نسبی سطوح انسداد ناشی می شود. Bergen و همکاران یک الگوریتم برای تخمین زدن تا بیش از دو حرکت مختلف بین یک همسایه شدت نشان دادند.

ترجمه مقاله فیزیک

الگوریتم مراحل زیر را استفاده می نماید: اجازه دهید تا v1 و v2 سرعتهای مجزا بین ناحیه تصویر دلخواه باشد. یک فرایند تکرار پذیر،  برای تخمین v1 و پیچش ناحیه تصویر مربوطه در دو فریم بعدی اعمال شده تا دو تصویر متفاوت را محاسبه نماید، D1 و D2  به نوبه خود برای تخمین v2 استفاده شده است. 

ترجمه مقاله فیزیک

  اگر v1 تخمین منطقی یک الگوی سرعت باشد، سپس ساختار شدت باقی مانده در D1 و D2 سرعت v2 را منعکس می کند. الگوریتم تا زمانی که تخمین های v1 و v2 ثابت شوند، تکرار می گردد. عموما کافی است تا ابتدا v1=v2=0  فر ض شود ، اگر هیچ گونه دانش اولیه  در مورد a در دسترس نباشد. روش حداقل مربعات برای حل کردن v1 و v2 با استفاده از (1.3) اعمال شده است.

روشهای دیگری برای اندازه گیری حرکت های متعدد وجود دارد: توزیع الگوی حرکت ممکن است به عنوان انطباق توزیع داده ها نشان داده شود.

Shizawa  و Mase اصل برهم نهی را به حرکتهای متعدد اعمال کردند و نشان دادند که الگوریتم های موجود برای جریان نوری، حرکت  3 بعدی و ساختار ها و غیره، می تواند تعمیم داده شود تا تعداد زیادی توزیع حرکت کنترل گردد.

به طور مشابه، حرکتهای متعدد ، می تواند به عنوان مجموعه ای از لایه ها فرض شود ، هر کدام یک حرکت ویژه در یک ناحیه ویژه را شرح می دهد.

ترجمه مقاله فیزیک

تکنیک های جداسازی این لایه ها، توسط تعداد زیادی از نویسندگان پیشنهاد شده است: Darrell و Pentland به وضوح از نواحی هموژن به حساب استفاده از چارچوب تخمین  قوی چندلایه مشترک  حمایت کردند.

Jepson  و Black  یک الگوریتم انتظار-ماکزیمم سازی (MA) برای یک گروه با انواع وسیعی از سرعت های اجزا به سمت تعداد لایه های ثابت استفاده کردند. 

ترجمه مقاله فیزیک

ایرانی و همکاران ، یک حرکت غالب را در یک تصویر ، با استفاده از شیوه حداقل مربعات تعیین کردند، و سپس حرکتهای زمینه را گروه بندی و قطعه بندی نمودند.

ترجمه مقاله فیزیک

روش های آنها فرض می کند که تنها یک حرکت غالب و تعداد زیادی حرکت زمینه وجود داد، که فرض می شود هر یک از آنها اشیاء متحرک مستقل کرتبط هستند. Adive از یک انتقال Hough روی میدان جریان نوری پیش محاسبه شده استفاده می کند تا نواحی دارای سرعتهای سازگار با سطوح تقریبا مسطح را گروه  بندی نماید.

این گروه بندی مبتنی یافتن سرعتهای همسایه که انتقالات affine را به اشتراک می گذارند، می باشد. 

 نگهداری پور و Lee یک فرایند قطعه بندی بر اساس روش دسته بندی سلسله مراتبی نشان دادند که میدان جریان نوری پیش محاسبه ضده را فرض نمی کند.

آنها یک مدل affin را به نواحی کوچک تصویر فیت کرده و سپس به صورت مکرر، نواحی همسایه را بر اساس شباهت پارامترهای affine آنها با هم ادغام کردند.

سپس، با توجه به نواحی مسطح بزرگ، محاسبات حرکت و ساختار می تواند انجام گیرد. Wang و Adelson از الگوریتم خوشه سازی برای گروه بندی سرعتها به صورت لایه ای استفاده کردند که هر یک با یک حرکت affine مطابق بود.

ترجمه مقاله فیزیک

Bober و Kittle یک انتقال Hough  مبتنی بر Block در تخمین قوی چارچوب استفاده کردند (هسته های نزولی) تا تخمینی قوی برای سرعت، شامل حرکتهای متعدد ،  به وسیله ی خوشه بندی حرکتهای ذاتی در زمان یکسانی که تخمین سرعت انجام می گیرد، به دست آید.

ترجمه مقاله فیزیک

دو سرعت قابل اطمینان بر اساس توابع پشتیبان، پیشنهاد شده است. بعلاوه، چارچوبهای سلسله مراتبی برای جداسازی اجزای حرکت با توجه به فرکانس های فضایی زمانی شناخته شده اند. Burt و همکاران پیشنهاد کردند کهه حرکتهای متعدد می تواند به طور جداگانه ، با استفاده از شبکه های فرکانس فضایی زمانی مختلف کنترل گردند.ترجمه مقاله فیزیک

3-4-2-مدل های پارامتری

مدل های پارامتری عموما، حرکت تصویر را با چند جمله ای دو متغیره مرتبه متغیر در مختصات تصویر شرح می دهند و محدودیت های قوی در حرکت فراهم می کنند که معمولا به استنباط دقیق جریان نوری منجر می گردد.  

ترجمه مقاله فیزیک

این مدل ها دارای کیفیت های مطلوب می باشند: حرکت نواحی بزرگ تصویر ممکن است به دلیل انعطاف رو به افزایش نمایش، با مجموعه منفردی از پارامترها شرح گردد.

بعلاوه، مدلهای پارامتری برای توضیح جریان نوری ناپیوسته کافی می باشند، مانند هر ناحیه ی قطعه بندی شده که ممکن است با مجموعه ی ویژه ای از پارامترهای حرکتی شرح داده شود. 

Bergen و همکاران ، محاسبه جریان نوری را از نقطه دید ثبت تصویر در نظر گرفتند: با توجه به توالی تصویر، پارامترهایی که یک تصویر را با (تصویر) بعدی در توالی هماهنگ می کنند  باید محاسبه گردند.

ترجمه مقاله فیزیک

این چارچوب، بسیاری از شیوه های حاضر در این بررسی را یکسان می نماید. در تمامی موارد، یک تابع باید با توجه به پارامترهای مختلف مدل سازی سرعت ، مینیمم شده باشد. الگوریتم آنها ، چهار جزء اصلی دارد: ساختار هرمی، تخمین حرکت، پیچش تصویر، و تصفیه بزرگ به کوچک. هرم لاپلاسین برای نمایش سلسله مراتبی داده تصویر استفاده شده و تخمین حرکت با مینیمم سازی SSD با توجه به مدل ویژه حرکت انجام شده است.

ترجمه مقاله فیزیک

پیچش تصویر از مقادیر پارامترهای حاضر برای محاسبه ی میدان جریان نوری در زمان t استفاده می کند و سپس تصویر دیگری را در زمان t، از تصویر زمان t-1 بازسازی می کند.

بازسازی تصویر، با استفاده از درونیابی دو خطی انجام شده است. تصویر پیچشی، سپس با تصویر اصلی مقایسه شده و یک اندازه ی خطا، مبتنی بر اختلاف تصویر، با استفاده از روش Gauss-newton مینیمم شده است. جزء آخر انتشار تخمین های حرکت از یک سطح هرم به سطح پایین بعدی ، جایی که آنها به عنوان حدس های اولیه برای تصفیه مکرر استفاده شده اند  می باشد.

ترجمه مقاله فیزیک

استفاده از دسته بندی Bergen و همکاران ، روش های جریان نوری، در بالا نشان داد که می تواند از نوع پارامتری ، شبه پارامتری یا غیر پارامتری تلقی گردد. مدل های پارامتری در کل حرکت منفرد با یک معادله ی دو متغیره را شرح می دهند. به عنوان مثال، مدل های affine، سرعت تصویر را  به صورت زیرتقریب می زنند:

که به طور منطقی زمانی که سطوح دور از بیننده باشد یا ناحیه تصویر تحت انالیز کوچک باشد ، معتبر می باشد.  این امر جریان نوری را به صورت یک بر هم نهی از حرکت و چرخش یکنواخت، اتساع و برش، مدل سازی می کند.

ترجمه مقاله فیزیک

این مدلی است  که توسط Fleet و Jepson استفاده گردید تا سرعتهای اجزا را در همسایه های محلی یکپارچه سازد.

همچنین Adive این مدل را استفاده کرد تا اندازه های سرعت را به مسیرهای مسطح محلی، در مرحله اول الگوریتم خود قطعه بندی و فیت نماید. Spetsakis یک مدل affine و یک سلسله مراتب فیلترهای Gabor را استفاده کرد. مدل دوم مسطح بودن سطوح محلی را فرض می نماید:

که روش تابع سرعت Waxman  و Wohn می باشد که آنها گسترش دادند تا سطوح منحنی مرتبه دوم را شامل شود. در (48-2) و (49-2) ، ai ها  سرعتهای مرکزی همسایه یا مشتقات سرعت مرتبه اول و دوم می باشند.

این پارامترها ، به طور کامل، سطح مسطح میدان سرعت را شرح می دهند. هر مدل سرعت ثابت، مانند Lucas و Kanade همچنین مثالهایی از مدل پارامتری هستند، گرچه بسیار ساده می باشند. معمولا،  مرتبه مدل پارامتری ، قابلیت کاربرد آن برای نواحی تصویر بزرگ را شرح می دهد.

مدل های غیر پارامتری، آنهایی هستند که نوعا در بازیابی جریان نوری جهانی استفاده شده اند. یکنواختی جهانی Horn و Schunk  ، و محدودیت یکنواختی جهت یافته Nagel، مثالهایی از مدل های غیر پارامتری هستند. مدلهای پبه پارامتری ار ترکیب مدل های پارامتری و غیر پارامتری استفاده می کنند.

Bergen و همکاران ، مدلهای حرکت صلب را در این دسته قرار دادند. حرکت صلب، از اشیاء صحنه دارای حرکت صلب، تحت بازتاب منظره ناشی می شوند.

ترجمه مقاله فیزیک

روش های حرکت و ساختار مستقیم مثالهایی از این مدل می باشند: Hanna نشان داد که فرضیات صلب می تواند برای غلبه بر مشکل شکاف در بسیاری از موارد استفاده گردد.

این مدل های پارامتری در یک چارچوب سلسله مراتبی یکنواخت نشان داده شده اند. راندمان سلسله مراتب ، کارایی محاسباتی را افزایش داده و همچنین به افزایش دقت و قدرت همراه با تصفیه های بزرگ به کوچک و پیچش تصویر اجازه می دهد.

Black و Jepson جریان نوری بزرگ را بایک روش همبستگی تعیین نمودند و مدل های پارامتری را برای نواحی قطعه بندی شده تصویر، به وسیله ی فرضیه سازی مسطح بودن محلی و استفاده از سرعت های بزرگ برای انجام قطعه بندی فیت کردند.

یکنیک های رگرسیون مبتنی بر ناحیه استاندارد ، این تخمین های حرکت را بیشتر تصفیه نمود. انحرافات از مسطح بودن، با اجازه به تغییر شکلهای محلی در تخمین های سرعت ، مدل سازی شد. از این رو، روش آنها، برای فیت کردن یک مدل پارامتری منفرد برای کل تصویر تلاش نمی کند، اما بسیاری از مدل های پارامتری برای نواحی قطعه بندی شده ی منفرد فیت می شوند.

ترجمه مقاله فیزیک

همچنین، حدادی و Kuo، یک مدل یکنواختی پارامتری را پیشنهاد کردند که جریان نوری را به میدان های غیر چرخشی و سیملوله ای تجزیه می کند و محدودیت یکنواختی را به هر فیلد مجزا منطبق می نماید. پارامترها مکررا بهبود یافته و یکنواختی در طی مرزهای حرکت اجتناب شده است.ترجمه مقاله فیزیک

5-2- روشهای تصفیه ی زمانی

روش های زیادی که در بالا برای محاسبه ی جریان نوری نشان داده شد، تخمین های حرکتی محاسبات قبلی را با توالی تصویر به دست آمده ترکیب نمی کنند: با توجه به دو یا تصاویر بیشتر، جریان نوری تنها برای یکی از تصاویر محاسبه شده است. اخیرا، توجه به محاسبات رو به افزایش جریان نوری وجود داشته است.

ترجمه مقاله فیزیک

فواید آن عبارتند از: دست یابی لحظه ای به تخمین های سرعت بهینه ، بهبود دقت به عنوان یکپارچگی جریان نوری در طی زمان  انجام شده است، کارایی محاسباتی با سازگاری تخمین ها با فریم حاضر به دست آمده و توانایی برای سازگاری با جریان نوری ناپیوسته به عنوان بیننده یا اشیاء صحنه، به طور ناگهانی حرکت آنها را تغییر می دهد.ترجمه مقاله فیزیک

الگوریتم های Black همچنین ممکن است به عنوان مدل افزایشی تلقی گردند، زیرا تابع هدفی را مینیمم می کند که حفظ شدت تصویر و انسجام فضایی زمانی را در یک چارچوب تخمین قوی ترکیب می کند.

ترجمه مقاله فیزیک

پیوستگی زمانی به پیش بینی سرعت تصویر بعدی، با فرض شتابدهی یکنواخت اجازه می دهد. پیچش همراه با درونیابی دوخطی برای تخمین شتاب استفاده شده است. Black و Anandan از روش Markov Random field (ARF) در فرمول بندی دوباره روش Black استفاده می کند.

الگوریتم MRF موازی، محلی می باشد و مرزها را در یک شیوه ی افزایشی آشکار می کند، اما به صورت فرمول بندی شده، تنها می تواند حرکتهای صحیح را کنترل نماید.

Singh ار فیلتر Kalman برای یکپارچه کردن تخمین های سرعت محاسبه شده توسط روش همبستگی سلسله مراتبی استفاده می کند.

ترجمه مقاله فیزیک

فیلتر Kalman عدم قطعیت تخمین های در طول زمان را کاهش می دهد. این چارچوب، همچنین مرزهای انسداد را آشکار می نماید. Fleet و Langley از فیلترهای بازگشتی گذر-پایین استفاده می کند  تا تخمین های سرعت مبتنی بر شیب را از توالی تصاویر تولید و سازگار نماید. Chin و همکاران، بسط الگوریتم چگال جریان نوری Horn و Schunck را نشان دادند که از محدودیت منسجم ذاتی برای تولید تخمین های جریان برگشتی نزدیک به بهینه از فریم های مختلف استفاده می کند. 

3- بحث

گرچه  روش ها و استراتژی های زیادی نشان داده شده اند، تخمین حرکت تصویر یک وظیفه ی چالش بر امگیز باقی مانده است: امروزه، به استثنای موقعیتهای محدود، هیچ تکنیکی قادر به تولید میدان های جریان نوری چگال و کافی نیست تا به بازیابی عمومی حرکت و پارامترهای صحنه در یک محیط واقعی اجازه دهد.

در حقیقت، الگوریتم های حرکت و ساختار به جراین نوری بسیار دقیق نیازمندند تا محاسبات مفید حرکت  و ساختار 3 بعدی را انجام دهند.

ترجمه مقاله فیزیک

همچنین نیازها، ابزارهای دقیق تعیین کننده اطمینان سرعتهای تصویر محاسبه شده می باشند.  چنین اندازه های مطمئنی پیشنهاد شده اند: مقادیر ویژه ی ماتریکس کوواریانس، منحنی گوسین، منحنی اصلی، شیب فضایی، مقادیر ویژه ی ماتریکس حداقل مربعات، و مقادیر تابع پشتیبان. این اندازه های قابل اطمینان برای آستانه، میدان های جریان نوری بسیار دقیق اما پراکنده را سبب می شوند. همچنین آنها می توانند در فرآیندهای متوالی ، مانند وزن ها در  محاسبه حداقل مربعات  حرکت و ساختار یکپارچه گردند.

از اهمیت تخمین دقیق حرکت تصویر در روش های بررسی شده این است که نیاز برای سرعتهای نمونه برداری فضایی زمانی مناسب وجود دارد، تا مشتقات فضایی زمانی دقیق برای روش های مبتنی بر دیفرانسیل محاسبه شود، تا نواحی جستجو برای روش های مبتنی بر انطباق را کاهش دهد یا مقدار aliasing را در زمان تخمین جریان نوری با روش های فیلترینگ مبتنی بر فرکانس محدود نماید. اغلب فرض اینکه تصویر عاری از alising باشد صورت می گیرد. دوربین های متداول، به ویژه برای حرکات تصویر چشمگیر ، معمولا تصویری با alising زمانی شدید تولید می کنند.

کاهش اثرات alising  ممکن است با افزایش سرعت نمونه برداری زمانی، پیش فیلترینگ تصویر یا با کاربرد فرایندهای سلسله مراتبی همراه باشد. البته، افزایش سرعت نمونه برداری زمانی به محاسبات جریان نوری بسیار دقیق منجر می گردد.

به هرحال، به دلایل متعددی، شامل پشتیبانی زمانی کم (تنها تعداد تصاویر کم) یا حرکت سریع تصویر، مانند تصویر نمونه برداری شده مناسب، همیشه در دسترس نیست. 

در چنین مواردی، ممکن است برای به دست آوردن مشتقات زمانی دقیق مشکل باشد، و روش های سلسله مراتبی مبتنی بر انطباق ، به نظر می رسد که یک انتخاب طبیعی باشند. همچنین مشاهده شده است  که برخی پیش فیلترهای توالی تصویر قبل از استخراج اندازه های تصویر اساسی، مانند مشتقات شدت یا سطوح همبستگی ، به طور چشمگیری دقت نتایج را افزایش می دهد.  

ترجمه مقاله فیزیک

 به عنوان مثال، یکنواختی گوسین فضایی زمانی توالی تصویر، به مشتقات بسیار دقیق روش های Lucas و Kanade و Horn و Schunck منجر می گردد. طرح های محاسباتی Anandan و  Singh ، همچنین از پیش فیلترینگ تصاویر با محاسبه تصاویر لاپلاسین سلسله مراتبی استفاده می کند. اعتقاد بر این است که این فیلترینگ high-pass به ساختار تصاویری تاکید می کند ک برای همبستگی مطلوب هستند.

اغلب بسیاری از فرضیات محدود در مورد حرکت تصویر ارائه شده اند. به عنوان مثال، یکی از این فرضیات نیاز دارد تا سرعتهای همسایه ناشی از حرکت نسبی سطح منفرد مشابه باشد. این نیازها معمولا با اعمال محدودیت یکنواختی ایزوتروپیک به تخمین های سرعت منطبق شده اند.

به هرحال، فقط تعداد موارد ساده اندکی از تصویر واقعی میدان حرکت پیوسته را نشان داد: تصویر واقعی، مانند صحنه های خارجی، ساختارهای پیچیده  برای فرضیات سطح منفرد جهانی که ناکافی هستند پیشنهاد می کند. تلاش ها برای تخمین حرکت تصویر ناپیوسته توسط Corneluis و Kanade و Negal به شکل  بازدارنده ی نیازهای یکنواختی در سراسر ناپیوستگی شدت پیشنهاد شده بود.

به هر حال مشاهده شده است که ناپیوستگی تصویر ممکن است ضرورتا ناپیوستگی تصویر را نشان ندهد. مشکل مطرح شده به وسیله انسداد سطوح نیازمند بررسی های بیشتر است.

ترجمه مقاله فیزیک

انسداد منبع مهم اطلاعات بصری می باشد: جریان نوری در مرزهای انسداد می تواند برای تعیین جهت انتقال (تمرکز انبساط) و قطعه بندی تصویر برای اشیاء متحرک مستقل استفاده شود، هنوز تخمین جریان نوری در انسداد مشکل ساز است.

روش های کافی برای کنترل انسداد روش های خطی را شامل می شود که به روشنی ناپیوستگی شدت را مدل سازی می کند و از یکنواختی روی آنها پیش گیری می کند، مدلهای پارامتری لایه ای یا منطبق بر هم، و مدلهای توزیع سرعت مختلط ، معمولا حضور دو سرعت را فرض می کنند و آنها را مپابق با برخی معیارها متمایز می نمایند. بعلاوه، انسداد ، اخیرا به شکل تجزیه ای در فضای فوریه شرح داده شده است.

ترجمه مقاله فیزیک

به طور متناوب، جریان نوری ممکن است  تنها با محدودیت های بومی تخمین زده شد. در این طرح ها، هیچ گونه نیاز یکنواختی اعمال نشده و ناپیوستگی تصویر ممکن است حفظ شود.البته، دقت در مرزهای حرکت یا در نواحی شفافیت، به نسبت زیادی به مدل حرکت استفاده شده بستگی دارد. به عنوان مثال، مدل های حرکت منفرد، برای کنترل درست انسداد شفافیت ناکافی هستند. با این وجود، استفاد از محدودیت های بومی یا مدلهای پارامتری به صورت معمول مناسب باشند، همانطور که هیچ نیاز یکنواختی روی ساختار جریان نوری منطبق نشده است.

ترجمه مقاله فیزیک

اثرات نوردهی همچنین یک مشکل را در بسیاری از توالی های تصاویر ایجاد می کند. روشنایی ثابت صحنه و بازتاب سطح Lambertian ، همچنین فرضیات آشکار و یا مبهم  برای بسیاری از روش های جریان نوری معمول می باشند که از فرضیات روشنایی ثابت استفاده می کند. گرچه، تاثیرات های لایت، سایه ها، و شرایط روشنایی در تخمین جریان نوری تنها تا یک مرتبه محدود مطالعه شده است، جبران جزئی برای این تاثیرات و تخمین حرکت تصویر به عنوان یک مقدار هندسی امکانپذیر می باشد،

اگر ویژگی های منبع نوری شناخته شده باشد. با این هدف، استفاده از منابع نوری متعدد و مجموعه محدودیت های چندطیفی روی حرکت تصویر استفاده شده اند. همچنین اثر سایه مدل سازی شده است.

جدا از شرایط روشنایی، برخی پدیده های بازتاب سطح، مشکلاتی را نشان داده اند. به عنوان مثال، سطوح شفاف، معمولا به حکت های متعدد منجر می شوند در حالی که های لایت ها ممکن است حرکتهای نادرست ایجاد نمایند.

شاید به دلیل سختی و کمیابی وقوع آن ، حرکتهای شفاف عمدتا نادیده گرفته شده اند و تلاشها برای تخمین حرکتهای متعدد ، شروع به ظاهر شدن نموده اند. روش های استفاده کننده از فیلترهای حساس به جهت و سرعت ، ممکن است در حل این مساله ویژه مشارکت نمایند ، همانطور که آنها اندازه کیریهای متعدد برای هر موقعیت فراهم می نمایند. متناوبا، اصول بر هم نهی و حرکتهای لایه ای چاچوبهای انیدبخشی هستند. به هرحال، اگر هیچ فرض قبلی روی تعداد توزیع های حاضر در ناحیه ی پشتیبان ایجاد نشود، قطعه بندی توزیع حرکت چندگانه مشکل باقی می ماند.ترجمه مقاله فیزیک

در نهایت مایلیم تاکید کنیم که بسیاری از منابع حرکت تصویر ، مثال های میدان جریان برای توالی تصویر کمی را نشان می دهند، که می تواند تنها از نظر کیفی قضاوت گردد. در حالی که تئوری محاسبه جریان نوری که مطرح شده است، اقدام جریان نوری اغلب ناچیز است: بیش از دو کار منتشر شده آنالیزهای  خطای کمی را فراهم می نماید. معمولا، تنها یک مقایسه ی کیفی امکانپذیر است.

حتی ، اغلب ارزیابی اینکه کدام تکنیک ها از نظر کمی بهتر هستند  ، همانطور که نویسندگان از توالی تصاویر مطلوب انها استفاده می کنند، کدام معمولا در دسترس جامعه نیست و برای کدام یک حرکت تصویر صحیح ناشناخته است، مشکل می باشد.

یک مجموعه وسیع در دسترس از عکس ها برای آزمایش های مقایسه ای مورد نیاز است. این تصاویر باید میدان های جریان نوری را بشناسند و به آنالیز خطاهای کمی اجازه دهند.

ترجمه مقاله فیزیک

این مخصوصا موردی برای کار جدید می باشد، با شیوه های لایه ای برای جریان نوری که آنالیزهای کمی کوچکی وجود دارد و یا فاقد انالیز کمی می باشند.

در این جا ابزارهای گوناگونی برای انجام آنالیزهای خطای کمی، زمانی که اطلاعات جریان نوری در دسترس باشد، وجود دارد: خطا می تواند به عنوان خطای مطلق، خطای نسبی، خطای زاویه ای، RMS، یا SNR نسبی بیان شود، که اجازه می دهد تا جریان های نوری را برای توالی تصویر مشابه مقایسه نماید.

بعلاوه، آنالیزهای کمی بدون اطلاعات حرمتی امکانپذیر است: خطای بازسازی تصویر RMS برای اندازه گیری خطای تولی تصویر واقعی استفاده شده است ، زمانی که اطلاعات صحیح حرکت تصویر در دسترس نباشد.

سایت های ترجمه