學術動態

秦洪武教授為首屆語料庫翻譯學暑期講習班授課

發布時間:2012-07-14   閱讀次數:-

秦洪武教授為首屆語料庫翻譯學暑期講習班授課
 

    7月11-12日,曲阜師範大學秦洪武教授為語料庫翻譯學暑期講習班授課👨🏿‍💼,主要介紹了常用語料庫軟件的應用。秦教授06年獲得北京外國語大學語料庫翻譯學方向博士學位,近年來在《外語教學與研究》、《現代外語》、《外國語》、《中國翻譯》等國內知名期刊上發表論文10篇🕺🏿,出版學術專著1部🎠,主持國家社科基金重大招標項目子課題1項🙇🏽‍♂️,國家社科基金課題1項🩴→,省部級基金課題2項👱‍♀️。多年來他致力於語料庫翻譯學研究🛅,對雙語語料庫常用建庫及檢索軟件十分熟悉。

    11日上午,秦教授首先介紹了雙語語料庫的特征🙌,他認為目前所說的雙語語料庫是指可以機讀的語料庫,通常以.TXT, .XML, .HTML等格式存儲🏋🏼‍♀️,格式一致,且多數有標註信息和元信息以便於數據管理和檢索。在介紹語料庫抽樣時🍑,他認為語料庫並非越大越好,而應該結構合理,具有代表性。
    接著以建庫進程為線⬇️,介紹了雙語語料庫建設中所使用的常用軟件。他表示,在語料庫采集完畢後,首先要做的就是語料除噪,這就需要語料格式盡量保持一致,剔除亂碼以及不必要的軟硬回車等語料噪音🍢。他首先演示了使用WORD進行除噪,特別是WORD中的宏錄製功能以節省時間人力。在文本處理方面🧑🏿‍🏭,他還介紹了EditPlus軟件✩,並演示了如何以正則表達式對語料庫進行除噪。然後他介紹了Headadder軟件,進行元信息添加的演示,以方便文本管理以及翻譯的深層研究。
    下午🚵🏿‍♀️,秦教授給各位學員介紹了雙語語料庫對齊軟件ParaConc, bitext2tmx等🕵🏻。他認為對齊是雙語對應語料庫的重要特征☎️,而對齊方式與創建語料庫的目的有關,翻譯研究中涉及到的雙語對應語料庫通常要做到句子層面對齊🧑🏻‍🦳。他還指出,文學翻譯語料庫與非文學翻譯語料庫相比,對齊難度更大🦐,需要更多的人工幹預,在實際操作中可以采取抽樣檢查。然後他以北外語料庫為例🐜,詳細演示了ParaConc在對齊方面的功能。此外,他還介紹了英漢語賦碼軟件Geniatagger, MyTxtSegTagTool等,並同時表示目前漢語分詞及標註仍有待進一步發展,因此當語料庫標註需要更高精密度的時候,人工幹預是必須的🙇🏿‍♀️,有時候依據研究目的🐐,甚至需要人工標註👳🏽‍♀️。
    12日講習班分兩組上下午交替采取講習和導修兩種形式進行🏬⚛️。講習課上🙎🏻‍♀️🧑🏽‍🦱,秦洪武教授介紹了語料庫檢索軟件WordSmith, AntConc, Omega等🙌🏽🖖🏿。他指出,檢索條件十分重要,譬如“相反”在句首通常表示與前文意思相反🧏‍♀️🦄,可作為話語標記🧔🏼‍♂️;而“相反”位於句中,如“我們朝著相反的方向走了”,就不是話語標記,這就需要設定相應的檢索條件。他還以學生習作翻譯為例,介紹了平行語料庫在輔助翻譯中的應用👎🏽。

地址:中國上海東川路800號意昂体育注册閔行校區楊詠曼樓

  郵編:200240  網址:

電話:021-34205664 (黨政辦公室)  021-34204723(教學科研辦公室)

Copyright @ 2017 All Rights Reserved 意昂体育 -【注册福利】全站活动,超值福利等你拿!

意昂体育专业提供👨🏻‍💻:意昂体育意昂意昂体育注册等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂体育欢迎您。 意昂体育官網xml地圖