
പാനസോണിക് രണ്ട് നൂതന AI സാങ്കേതികവിദ്യകൾ വികസിപ്പിക്കുന്നു,
CVPR2021-ലേക്ക് സ്വീകരിച്ചു,
ലോകത്തിലെ പ്രമുഖ അന്താരാഷ്ട്ര AI സാങ്കേതിക സമ്മേളനം
[1] ഹോം ആക്ഷൻ ജീനോം: കോൺട്രാസ്റ്റീവ് കോമ്പോസിഷണൽ ആക്ഷൻ അണ്ടർസ്റ്റാൻഡിംഗ്
ക്യാമറകൾ, മൈക്രോഫോണുകൾ, തെർമൽ സെൻസറുകൾ എന്നിവയുൾപ്പെടെ നിരവധി തരം സെൻസറുകൾ ഉപയോഗിച്ച്, വീടുകളിലെ മനുഷ്യന്റെ ദൈനംദിന പ്രവർത്തനങ്ങൾ ശേഖരിക്കുന്ന ഒരു പുതിയ ഡാറ്റാസെറ്റ് "ഹോം ആക്ഷൻ ജീനോം" ഞങ്ങൾ വികസിപ്പിച്ചതായി അറിയിക്കുന്നതിൽ ഞങ്ങൾക്ക് സന്തോഷമുണ്ട്. ലിവിംഗ് സ്പെയ്സുകൾക്കായി ലോകത്തിലെ ഏറ്റവും വലിയ മൾട്ടിമോഡൽ ഡാറ്റാസെറ്റ് ഞങ്ങൾ നിർമ്മിച്ച് പുറത്തിറക്കി, അതേസമയം ലിവിംഗ് സ്പെയ്സുകൾക്കായി മിക്ക ഡാറ്റാസെറ്റുകളും സ്കെയിലിൽ ചെറുതായിരുന്നു. ഈ ഡാറ്റാസെറ്റ് പ്രയോഗിക്കുന്നതിലൂടെ, ലിവിംഗ് സ്പെയ്സിലെ ആളുകളെ പിന്തുണയ്ക്കുന്നതിനായി മെഷീൻ ലേണിംഗിനും AI ഗവേഷണത്തിനുമുള്ള പരിശീലന ഡാറ്റയായി AI ഗവേഷകർക്ക് ഇത് ഉപയോഗിക്കാൻ കഴിയും.
മുകളിൽ പറഞ്ഞവയ്ക്ക് പുറമേ, മൾട്ടിമോഡൽ, മൾട്ടിപ്പിൾ വ്യൂപോയിന്റുകളിൽ ശ്രേണിപരമായ പ്രവർത്തന തിരിച്ചറിയലിനായി ഞങ്ങൾ ഒരു സഹകരണ പഠന സാങ്കേതികവിദ്യ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്. ഈ സാങ്കേതികവിദ്യ പ്രയോഗിക്കുന്നതിലൂടെ, വ്യത്യസ്ത വ്യൂപോയിന്റുകളിൽ, സെൻസറുകളിൽ, ശ്രേണിപരമായ പെരുമാറ്റരീതികളിൽ, വിശദമായ പെരുമാറ്റ ലേബലുകളിൽ സ്ഥിരതയുള്ള സവിശേഷതകൾ നമുക്ക് പഠിക്കാൻ കഴിയും, അങ്ങനെ ജീവനുള്ള ഇടങ്ങളിലെ സങ്കീർണ്ണമായ പ്രവർത്തനങ്ങളുടെ തിരിച്ചറിയൽ പ്രകടനം മെച്ചപ്പെടുത്താൻ കഴിയും.
ഡിജിറ്റൽ AI ടെക്നോളജി സെന്റർ, ടെക്നോളജി ഡിവിഷൻ, സ്റ്റാൻഫോർഡ് യൂണിവേഴ്സിറ്റിയിലെ സ്റ്റാൻഫോർഡ് വിഷൻ ആൻഡ് ലേണിംഗ് ലാബ് എന്നിവയുമായി സഹകരിച്ച് നടത്തിയ ഗവേഷണത്തിന്റെ ഫലമാണ് ഈ സാങ്കേതികവിദ്യ.
ചിത്രം1: സഹകരണ കോമ്പോസിഷണൽ ആക്ഷൻ അണ്ടർസ്റ്റാൻഡിംഗ് (CCAU) എല്ലാ രീതികളെയും ഒരുമിച്ച് സഹകരിച്ച് പരിശീലിപ്പിക്കുന്നത് മെച്ചപ്പെട്ട പ്രകടനം കാണാൻ നമ്മെ അനുവദിക്കുന്നു.
വീഡിയോ-ലെവൽ, ആറ്റോമിക് ആക്ഷൻ ലേബലുകൾ എന്നിവ ഉപയോഗിച്ചുള്ള പരിശീലനം ഞങ്ങൾ ഉപയോഗപ്പെടുത്തുന്നു, അതുവഴി വീഡിയോകൾക്കും ആറ്റോമിക് പ്രവർത്തനങ്ങൾക്കും അവ തമ്മിലുള്ള ഘടനാപരമായ ഇടപെടലുകളിൽ നിന്ന് പ്രയോജനം ലഭിക്കുന്നു.
[2] ഓട്ടോഡോ: സ്കേലബിൾ പ്രോബബിലിസ്റ്റിക് ഇംപ്ലിസിറ്റ് ഡിഫറൻഷ്യേഷൻ വഴി ലേബൽ നോയ്സുള്ള ബയസ്ഡ് ഡാറ്റയ്ക്കായുള്ള റോബസ്റ്റ് ഓട്ടോഓഗ്മെന്റ്.
പരിശീലന ഡാറ്റയുടെ വിതരണത്തിനനുസരിച്ച് ഒപ്റ്റിമൽ ഡാറ്റ ഓഗ്മെന്റേഷൻ സ്വയമേവ നിർവഹിക്കുന്ന ഒരു പുതിയ മെഷീൻ ലേണിംഗ് സാങ്കേതികവിദ്യ ഞങ്ങൾ വികസിപ്പിച്ചതായി അറിയിക്കുന്നതിൽ ഞങ്ങൾക്ക് സന്തോഷമുണ്ട്. ലഭ്യമായ ഡാറ്റ വളരെ കുറവുള്ള യഥാർത്ഥ ലോക സാഹചര്യങ്ങളിൽ ഈ സാങ്കേതികവിദ്യ പ്രയോഗിക്കാൻ കഴിയും. ലഭ്യമായ ഡാറ്റയുടെ പരിമിതികൾ കാരണം AI സാങ്കേതികവിദ്യ പ്രയോഗിക്കാൻ ബുദ്ധിമുട്ടുള്ള നിരവധി സാഹചര്യങ്ങൾ ഞങ്ങളുടെ പ്രധാന ബിസിനസ്സ് മേഖലകളിലുണ്ട്. ഈ സാങ്കേതികവിദ്യ പ്രയോഗിക്കുന്നതിലൂടെ, ഡാറ്റ ഓഗ്മെന്റേഷൻ പാരാമീറ്ററുകളുടെ ട്യൂണിംഗ് പ്രക്രിയ ഇല്ലാതാക്കാനും പാരാമീറ്ററുകൾ യാന്ത്രികമായി ക്രമീകരിക്കാനും കഴിയും. അതിനാൽ, AI സാങ്കേതികവിദ്യയുടെ ആപ്ലിക്കേഷൻ ശ്രേണി കൂടുതൽ വ്യാപകമായി വ്യാപിപ്പിക്കാൻ കഴിയുമെന്ന് പ്രതീക്ഷിക്കാം. ഭാവിയിൽ, ഈ സാങ്കേതികവിദ്യയുടെ ഗവേഷണവും വികസനവും കൂടുതൽ ത്വരിതപ്പെടുത്തുന്നതിലൂടെ, പരിചിതമായ ഉപകരണങ്ങളും സിസ്റ്റങ്ങളും പോലുള്ള യഥാർത്ഥ ലോക പരിതസ്ഥിതികളിൽ ഉപയോഗിക്കാൻ കഴിയുന്ന AI സാങ്കേതികവിദ്യ യാഥാർത്ഥ്യമാക്കാൻ ഞങ്ങൾ പ്രവർത്തിക്കും. അമേരിക്കയിലെ പാനസോണിക് ആർ & ഡി കമ്പനിയുടെ AI ലബോറട്ടറിയിലെ ടെക്നോളജി ഡിവിഷനിലെ ഡിജിറ്റൽ AI ടെക്നോളജി സെന്റർ നടത്തിയ ഗവേഷണത്തിന്റെ ഫലമാണ് ഈ സാങ്കേതികവിദ്യ.
ചിത്രം 2: ഡാറ്റ ഓഗ്മെന്റേഷന്റെ (ഷെയേർഡ്-പോളിസി ഡിഎ ഡയലമ) പ്രശ്നം ഓട്ടോഡോ പരിഹരിക്കുന്നു. ഓഗ്മെന്റഡ് ട്രെയിൻ ഡാറ്റയുടെ (ഡാഷ്ഡ് ബ്ലൂ) വിതരണം ലേറ്റന്റ് സ്പെയ്സിലെ ടെസ്റ്റ് ഡാറ്റയുമായി (സോളിഡ് റെഡ്) പൊരുത്തപ്പെടണമെന്നില്ല:
"2" എന്നത് അണ്ടർ-ഓഗ്മെന്റ് ചെയ്തിരിക്കുന്നു, അതേസമയം "5" എന്നത് ഓവർ-ഓഗ്മെന്റ് ചെയ്തിരിക്കുന്നു. തൽഫലമായി, മുൻ രീതികൾക്ക് ടെസ്റ്റ് ഡിസ്ട്രിബ്യൂഷനുമായി പൊരുത്തപ്പെടാൻ കഴിയില്ല, കൂടാതെ പഠിച്ച ക്ലാസിഫയർ f(θ) ന്റെ തീരുമാനം കൃത്യമല്ല.
ഈ സാങ്കേതികവിദ്യകളുടെ വിശദാംശങ്ങൾ CVPR2021-ൽ (2017 ജൂൺ 19 മുതൽ നടക്കുന്ന) അവതരിപ്പിക്കും.
മുകളിലുള്ള സന്ദേശം പാനസോണിക് ഔദ്യോഗിക വെബ്സൈറ്റിൽ നിന്നാണ്!
പോസ്റ്റ് സമയം: ജൂൺ-03-2021